作者:無缺更新时间:2024-04-17阅读:0
本文将分析国内和海外大模型,为用户学习大模型提供建议。
OpenAI的GPT系列:包括GPT-3、GPT-4以及GPT-4 Turbo等,这些模型在自然语言处理领域具有重要影响力,能够执行多种语言任务。
Google的PaLM和Gemini:Google推出的大模型,PaLM 2和Gemini等现象级大模型,展现了在多模态学习和大型语言模型方面的进步。
Anthropic的Claude系列:Anthropic是前OpenAI高管创立的公司,推出了Claude和Claude 2等大模型,强调打造“安全且负责任的AI”。
Amazon Web Services (AWS) 的Titian:AWS发布的Titian大模型,以及正在训练中的、内部代号为「Olympus」的大模型,参数将高达2万亿。
Meta的Llama 2:Meta(Facebook的母公司)推出的Llama 2大模型,是开源大模型中的佼佼者,展现了Meta在AI领域的研究实力。
TII的Falcon 180B:阿联酋技术创新研究所(TII)发布的Falcon 180B大模型,成为迄今为止最强的开源大模型之一。
DeepMind的Genie:谷歌旗下“深度思维”公司发布的Genie模型,能够通过单张图像提示生成可玩的交互式环境。
OpenAI的Sora:OpenAI发布的首个人工智能文生视频大模型,能够根据简要文字指令生成逼真视频。
百度的ERNIE:ERNIE是百度开发的自然语言处理模型,广泛应用于多种语言理解任务。
华为的盘古:华为推出的盘古大模型,旨在赋能多个行业,特别是针对B端业务的数字化场景。
阿里巴巴的M6:阿里巴巴的M6大模型,是一个多模态的人工智能模型,能够处理文本、图像等多种类型的数据。
商汤科技的日日新SenseNova:商汤科技的大模型体系,寓意“苟日新、日日新、又日新”,旨在不断更新迭代,解锁更多可能性。
科大讯飞的星火:科大讯飞发布的大模型,专注于语音识别和自然语言处理技术。
海光信息的深算:海光信息的DCU系列产品,基于GPU架构,适用于大数据处理、人工智能、商业计算等领域。
浪潮信息的AI服务器:浪潮信息提供的AI服务器,用于大模型训练和推理,支持国产AI芯片。
寒武纪的思元:寒武纪推出的AI芯片,用于大模型训练和推理,具有高性能计算能力。
云知声的山海:云知声推出的大模型,具有庞大的训练数据和海纳百川的能力,专注于语言理解。
网易伏羲的玉言和丹青:网易伏羲的大语言模型“玉言”和AI作画模型“丹青”,分别服务于图文、音乐等领域和文生图应用。
中国移动的九天:中国移动发布的大模型,面向政务和客服领域。
蚂蚁集团的贞仪:蚂蚁集团正在研发的大模型“贞仪”,象征着精确、公正和智慧。
国家超级计算天津中心的天河天元:旨在走出一条完整的信创路线,支撑中国生成式智能创新发展。
京东的ChatJD:京东即将发布的新一代大模型,定位为产业版本ChatGPT。
中国电信的TeleChat:中国电信的数据中台产品、智能客服领域的大模型。
中科院的紫东太初:中科院推出的全模态大模型,旨在打造全栈国产化通用人工智能底座。
智源人工智能研究院的悟道·天鹰:智源研究院推出的大模型,蕴含道家哲学元素。
阿里达摩院的八卦炉:阿里达摩院推出的“脑级人工智能模型”,用于超算基础实现。