模型
  • 【大模型】通义千问safetensors
    12-2723
    【大模型】通义千问safetensors

    【大模型】通义千问safetensors_rust.SafetensorError: Error while deserializing header: HeaderTooLarge解决方法通义千问介绍Requirements模型下载模...

  • Azure Machine Learning - Azure OpenAI GPT 3.5 Turbo 微调教程
    12-2723
    Azure Machine Learning - Azure OpenAI GPT 3.5 Turb

    本教程将引导你在Azure平台完成对 gpt-35-turbo-0613 模型的微调。关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机器人智能实验室成员,...

  • OpenAI开发系列(二):大语言模型发展史及Transformer架构详解
    12-2523
    OpenAI开发系列(二):大语言模型发展史及Transformer架构详解

    全文共1.8w余字,预计阅读时间约60分钟 | 满满干货,建议收藏!一、介绍 在2020年秋季,GPT-3因其在社交媒体上病毒式的传播而引发了广泛关注。这款拥有超过1.75亿参数和每秒运行成本达到100万美元的大型语言模型(Large...

  • 【联邦学习(Federated Learning)】- 从基本分布式思想开始理解联邦学习
    12-2123
    【联邦学习(Federated Learning)】- 从基本分布式思想开始理解联邦学习

    文章目录联邦学习的基本概念联邦学习的定义联邦学习的特点分布式机器学习面向扩展性的分布式机器学习面向隐私保护的分布式机器学习分布式机器学习平台联邦学习架构C-S架构P2P对等网络架构 联邦学习的基本概念 联邦学习的定义 机器学...

  • LLMs之Code:SQLCoder的简介、安装、使用方法之详细攻略
    12-2123
    LLMs之Code:SQLCoder的简介、安装、使用方法之详细攻略

    LLMs之Code:SQLCoder的简介、安装、使用方法之详细攻略 目录 SQLCoder的简介 1、结果 2、按问题类别的结果 SQLCoder的安装 1、硬件要求 2、下载模型权重 3、使用SQLCoder 4、Colab中运行S...

  • 【Python开发】FastAPI 10:SQL 数据库操作
    12-2123
    【Python开发】FastAPI 10:SQL 数据库操作

    在 FastAPI 中使用 SQL 数据库可以使用多个 ORM 工具,例如 SQLAlchemy、Tortoise ORM 等,类似 Java 的 Mybatis 。这些 ORM 工具可以帮助我们方便地与关系型数据库进行交互,如 MySQL...

  • 【ChatGPT】使用 GPT-4 探索大模型在“智能数据应用”领域的应用思路:NLP ---> DSL ---> SQL(ChatGPT DSL 能力挖掘) 2
    12-2023
    【ChatGPT】使用 GPT-4 探索大模型在“智能数据应用”领域的应用思路:NLP ---> D

    【ChatGPT】使用 GPT-4 探索大模型在“智能数据应用”领域的应用思路:NLP —> DSL —> SQL(ChatGPT DSL 能力挖掘) 2 user: 这是SQL DSL 代码:CQL.go CQL DSL Mo...

  • MAMBA介绍:一种新的可能超过Transformer的AI架构
    12-2023
    MAMBA介绍:一种新的可能超过Transformer的AI架构

    有人说,“理解了人类的语言,就理解了世界”。一直以来,人工智能领域的学者和工程师们都试图让机器学习人类的语言和说话方式,但进展始终不大。因为人类的语言太复杂,太多样,而组成它背后的机制,往往又充满着不可名状的规律。 过去人们在自然语言处理中...

  • 第一次数学建模赛后总结
    12-1923
    第一次数学建模赛后总结

    大家好,这里是七七。 前些日子参加了一次数学建模比赛,赛后总结了一下,发现有很多事情是到了动手操作的时候,才发现问题的。总结了一下,有以下几点。 一、准备 在赛前准备阶段只傻傻的准备了很多学校给我们列举的数学模型和方法,但当到了比赛中时,就...

  • Django ImportError:cannot import name from partially initialized module (不同app间的模型循环导入的问题)
    12-1823
    Django ImportError:cannot import name from partial

    背景: 有两个APP,互相引用对方models.py的模型作为外键,app1中的models.py引用了app2的模型B,app2中的models.py引用了app1的模型A错误写法: # 这样写会出现报错: Django ImportEr...

  • 改进召回(Retrieval)和引入重排(Reranking)提升RAG架构下的LLM应用效果
    12-1823
    改进召回(Retrieval)和引入重排(Reranking)提升RAG架构下的LLM应用效果

    改进召回(Retrieval)和引入重排(Reranking)提升RAG架构下的LLM应用效果 原创 ully AI工程化 2023-08-24 21:08 收录于合集 #LLM应用架构3个 #领域技术13个 动手点关注干货不迷路如...

  • Stable Diffusion XL训练LoRA
    12-1423
    Stable Diffusion XL训练LoRA

    主要包括SDXL模型结构,从0到1训练SDXL以及LoRA教程,从0到1搭建SDXL推理流程。  【一】SDXL训练初识 Stable Diffusion系列模型的训练主要分成一下几个步骤,Stable Diffusion XL也不例外:...

  • LLMs模型速览(GPTs、LaMDA、GLMChatGLM、PaLMFlan-PaLM、BLOOM、LLaMA、Alpaca)
    12-1423
    LLMs模型速览(GPTs、LaMDA、GLMChatGLM、PaLMFlan-PaLM、BLOOM

    文章目录一、 GPT系列1.1 GPTs(OpenAI,2018——2020)1.2 InstructGPT(2022-3)1.2.1 算法1.2.2 损失函数1.3 ChatGPT(2022.11.30)1.4 ChatGPT...

  • 【多模态】4、Chinese CLIP | 专为中文图文匹配设计
    12-1423
    【多模态】4、Chinese CLIP | 专为中文图文匹配设计

    文章目录一、背景二、方法2.1 基础内容2.2 数据集2.3 预训练方法2.4 模型尺寸 三、效果四、代码4.1 推理 论文:Chinese CLIP: Contrastive Vision-Language Pretrai...

  • Stable Diffusion4
    12-1423
    Stable Diffusion4

    这个也发到第4回了~~ 输入一句话,就能把图片修改好, 自用的好工具真是挺有用的 , AI 正在向图片生成领域发起挑战,各大科技公司、高校等开始纷纷涉足。最近一段时间,关心 AI 圈的人可能都有这样一种感受:扩散模型被越来越多的人提及,基于...

  • AIGC专栏1——Pytorch搭建DDPM实现图片生成
    12-1423
    AIGC专栏1——Pytorch搭建DDPM实现图片生成

    AIGC专栏1——Pytorch搭建DDPM实现图片生成学习前言源码下载地址网络构建一、什么是Diffusion1、加噪过程2、去噪过程 二、DDPM网络的构建(Unet网络的构建)三、Diffusion的训练思路利用DDPM生...

  • unity 使用Vuforia扫描实体物体交互
    12-1423
    unity 使用Vuforia扫描实体物体交互

    文章目录前言一、Vuforia是什么?二、Unity导入Vuforia1.去Unity - Windows – Asset Store,搜vuforia engine,添加到我的资源2.从 Unity 的菜单 Assets ->...

  • 【教程】逻辑回归怎么做多分类
    12-1423
    【教程】逻辑回归怎么做多分类

    目录 一、逻辑回归模型介绍 1.1 逻辑回归模型简介 1.2 逻辑回归二分类模型 1.3 逻辑回归多分类模型 二、如何实现逻辑回归二分类 2.1 逻辑回归二分类例子 2.2 逻辑回归二分类实现代码 三、如何实现一个逻辑回归多分类 3.1 逻...

  • A Survey of the Usages of Deep Learning for Natural Language Processing
    12-1423
    A Survey of the Usages of Deep Learning for Natura

    摘要 在过去的几年里,自然语言处理领域得到了深度学习模型应用激增的推动。本文简要介绍了该领域,并对深度学习的架构和方法进行了快速概述。接着,文章查阅了大量的最新研究,并总结了许多相关的贡献。分析的研究领域包括一些核心的语言处理问题,以及计算...

  • 基于pytorch 的RNN实现文本分类
    12-1423
    基于pytorch 的RNN实现文本分类

    首先,需要导入必要的库,包括torch、torchtext、numpy等: import torchimport torch.nn as nnimport torch.optim as optimimport numpy as npfrom...