通过 modules 对比平台,可以查看到不同的厂商和它们的 modules。如:https://artificialanalysis.ai/
todo
github:https://github.com/deepseek-ai
hugging face:https://huggingface.co/deepseek-ai
| 模型名称 | 归属厂商/公司/创始人 | 简要介绍 |
|---|---|---|
| GPT | OpenAI(Sam Altman) | 多模态旗舰模型,推理与生成能力超越前代,支持文本、图像、视频等多种输入 |
| Sora | OpenAI(Sam Altman) | 文生视频多模态模型,支持文本、图像与视频生成,推动多媒体交互升级 |
| DALL‑E 3 | OpenAI(Sam Altman) | 多模态图像生成模型新作,支持高质量文本到图像生成,细节表现更丰富、风格多样化 |
| Gemini 2.0 | Google DeepMind | 原生多模态升级版,采用“闪电思维”技术强化跨模态推理与逻辑表达 |
| Imagen | Google DeepMind | 文生图,与 DALL‑E 3 形成互补 |
| PaLM‑2 | 多语言专家新作,在数学、编程、翻译等任务上进一步优化,支撑新版Bard | |
| Claude 3.5 | Anthropic(Dario Amodei) | 长上下文对话模型升级,安全合规性更高,token容量扩展至更大规模 |
| LLaMA 3 | Meta(Mark Zuckerberg) | 开源模型家族新作,参数规模与推理效率均获提升,推动学术与生态扩展 |
| Grok 2.0 | xAI(Elon Musk) | 实时数据驱动升级版,保留一定讽刺风格,交互与信息更新能力增强 |
| Falcon 220B | TII(阿联酋) | 开源商用升级版,参数扩展至220B,训练数据与能耗信息公开透明 |
| Mistral 7B/8x22B | Mistral AI(欧洲团队) | 高性能开源模型,新版本在推理效率与精度上均有优化,适合商业化部署 |
| Stable LM 3 | Stability AI | 多语言开源生成模型升级版,生成质量提升,并持续优化Apache 2.0许可 |
| Amazon Titan V2 | 亚马逊 | 企业级多模态模型新作,深度整合AWS生态,文本与图像生成能力进一步增强 |
| Cohere Command+ | Cohere(Aidan Gomez) | 文本生成与语义搜索API升级,响应速度和准确性均得到改进 |
| Jurassic‑3 | AI21 Labs | 商业API模型新版本,支持法律、医疗等定制化场景,多语言生成能力加强 |
| BLOOMZ 2 | Hugging Face(国际协作) | 开源协作项目新作,覆盖语言种类更多,训练策略和性能均获优化 |
| Gopher/Chinchilla | DeepMind | 研究型模型仍作为学术基准关注参数与数据效率平衡 |
| Phi‑4 系列 | 微软(Satya Nadella) | 轻量级模型升级版,支持手机端部署,提供4K及128K上下文版本,性能媲美前代 |
| Pi 2.0 | Inflection(Mustafa Suleyman) | 情感化对话模型新作,进一步优化共情表达与个性化交互体验 |
| 模型名称 | 归属厂商/公司/创始人 | 简要介绍 |
|---|---|---|
| DeepSeek-V3/R1 | DeepSeek(深度求索) | 新一代多模态大模型,训练效率大幅提升、推理成本降低,支持文本、图像、视频生成 |
| Janus‑Pro | DeepSeek | 开源多模态模型升级版,采用统一 Transformer 架构与解耦视觉编码技术,通过优化训练策略和扩展训练数据,实现图像生成与理解任务,文生图性能超越 DALL‑E 3,提供 1B/7B 两种版本 |
| 百川系列 3.0 (Baichuan Series 3.0) | 百川智能(王小川) | 中文开源模型升级版,参数规模与商业化部署能力显著提升 |
| 文心一言 3.0 (Wenxin Yiyan 3.0) | 百度(李彦宏) | 中文旗舰模型新作,融合搜索、知识图谱与多模态生成,表现更强 |
| 通义千问 2.0 (Tongyi Qianwen 2.0) | 阿里云(张勇) | 针对电商及办公场景优化升级,集成于钉钉、天猫精灵等生态 |
| 星火大模型 2.0 (iFlytek Spark 2.0) | 科大讯飞(刘庆峰) | 语音交互与多模态生成升级版,应用覆盖教育、医疗等领域 |
| ChatGLM 4 (ChatGLM 4) | 清华+智谱AI(唐杰) | 中英双语对话模型新版本,在学术与工业应用中均有更优表现 |
| 日日新 2.0 (SenseNova 2.0) | 商汤科技(徐立) | 多模态生成升级版,涵盖语言、图像及3D,产业落地应用更为成熟 |
| 混元大模型 2.0 (Hunyuan 2.0) | 腾讯(马化腾) | 全链路自研模型新作,支持文生图、视频生成,适用于社交、游戏等场景 |
| 盘古大模型 2.0 (Pangu 2.0) | 华为 | 行业解决方案型模型升级,多模态能力显著提升,重点面向B端应用 |
| 云雀 2.0 (Lark 2.0) | 字节跳动 | 内容生成与交互模型升级版,深度整合于飞书平台,体验和性能双改进 |
| 360智脑 Pro (360 AI Brain Pro) | 三六零(周鸿祎) | 安全与代码生成强化版,支持多轮对话及企业级安全防护 |
| 天工大模型 2.0 (Skywork 2.0) | 昆仑万维 | 开源中英双语模型升级版,针对代码和数学任务表现优化 |
| Shoot-AI (Shoot-AI) | 浙江水科文化集团 | 定制化AI模型,整合人脸识别、智能拍摄及语音生成,广泛应用于文旅等场景 |
| 豆包 (Doubao) | 字节跳动 | 国内新秀大模型,专注高效文本生成与场景应用,具备轻量级部署优势 |
| Kimi (Kimi) | 月之暗面 | 定制化对话模型,面向多领域专业应用,交互体验与定制化能力显著 |
| 阶跃星辰 (StepStar) | 阶跃星辰 | 新兴大模型,聚焦行业场景应用,数学与代码生成能力突出 |
| 悟道大模型 3.0 (Wudao 3.0) | 智源人工智能研究院 | 中文旗舰模型新作,融合多模态生成与理解能力,适用于对话、内容创作及行业定制化应用 |