
GPT-4o Mini 是 OpenAI 最新推出的小型智能模型,专为高性能和低成本的人工智能解决方案而设计。它支持文本、视觉、音频等多模态输入输出,响应速度极快,适用于实时应用场景。GPT-4o Mini 在数学推理和编码任务上表现出色,并且能够处理大量上下文信息。其价格比之前的模型便宜一个数量级,每百万输入 token 仅需 15 美分,每百万输出 token 60 美分。无论是内容创建、问题解决、复杂数据分析还是代码生成,GPT-4o Mini 都能提供卓越的性能和经济的解决方案。 GPT-4o Mini:OpenAI 最新推出的高效、经济的小型模型 GPT-4o Mini的评测 GPT-4o mini 在文本智能和多模态推理方面的学术基准测试中都超过了 GPT-3.5 Turbo 和其他小型模型,并支持与 GPT-4o 相同的语言范围。它还在函数调用方面表现出强大的性能,这使开发人员能够构建获取数据或使用外部系统执行操作的应用程序,并且与 GPT-3.5 Turbo 相比,它提高了长上下文性能。 GPT-4o mini 已在几个关键基准测试中进行了评估 。 推理任务:GPT-4o mini 在涉及文本和视觉的推理任务方面优于其他小型模型,在文本智能和推理基准 MMLU 上得分为 82.0%,而 Gemini Flash 为 77.9%,Claude Haiku 为 73.8%。 数学和编码能力:GPT-4o mini 在数学推理和编码任务方面表现出色,优于市场上以前的小型型号。在 MGSM 上,衡量数学推理,GPT-4o mini 得分为 87.0%,而 Gemini Flash 为 75.5%,Claude Haiku 为 71.7%。GPT-4o mini 在衡量编码性能的 HumanEval 上得分为 87.2%,而 Gemini Flash 为 71.5%,Claude Haiku 为 75.9%。 多模态推理:GPT-4o mini 在多模态推理评估 MMMU 上也表现出强劲的表现,得分为 59.4%,而 Gemini Flash 为 56.1%,Claude Haiku 为 50.2%。 定价 GPT-4o mini 现在可在 Assistants API、Chat Completions API 和 Batch API 中用作文本和视觉模型。开发人员每 1M 输入令牌支付 15 美分,每 1M 输出令牌支付 60 美分(大约相当于一本标准书中的 2500 页)。我们计划在未来几天内推出 GPT-4o mini 的微调。 在 ChatGPT 中,Free、Plus 和 Team 用户将从今天开始访问 GPT-4o mini,而不是 GPT-3.5。从下周开始,企业用户也可以使用,这符合我们的使命,即让所有人都能享受人工智能的好处。
数据统计
相关导航

序列猴子是出门问问自研的一款大语言模型,它以语言为核心的能力体系涵盖了知识、对话、数学、逻辑、推理和规划等六个维度。它可以同时支持文字生成、图片生成、3D内容生成、语音生成和语音识别等不同任务,展现出强大的多模态表达能力。

天谱乐
天谱乐是唱鸭旗下的AI音乐品牌,为用户提供个性化、智能化的音乐创作体验。它支持文本、图片和视频生成音乐,让创作变得简单便捷。利用先进的多模态理解与生成技术,天谱乐能够生成与图片和视频情感高度契合的音乐,并提供发行级的歌曲创作服务。无论是专业音乐人还是普通爱好者,天谱乐都能帮助您高效创作出独一无二的音乐作品。

Face Adapter
Face Adapter 是一种专门为预训练的扩散模型设计的适配器,主要用于面部重演和面部交换任务。它能够实现高精度和高保真度的面部编辑,提供精细的个体识别和属性控制功能。

Imagen 3
Imagen 3是Google DeepMind开发的最新文生图大模型。它能够根据文本提示生成高质量、高分辨率的图像,具有更好的细节和丰富的光照效果。这个模型支持多种视觉风格,从照片般逼真到油画质感,甚至黏土动画场景。Imagen 3还改进了对自然语言提示的理解,简化了生成所需图像的过程,并采用了最新的安全和责任技术,包括隐私保护和内容安全。

Hyper-SD
Hyper-SD 是字节跳动推出的一种先进图像生成框架,结合了轨迹分段一致性蒸馏(TSCD)和人类反馈学习(RLHF),显著提升了扩散模型在少步骤推理下的图像生成性能。通过 Hyper-SD,用户可以在 1 到 8 步的推理过程中生成高质量的图像,极大地提高了生成速度和效率。

Auto-GPT
Auto-GPT 是一个使用 GPT-4 语言模型来自动执行多步骤项目的开源应用程序。它可以让 GPT-4 自主行动,根据自然语言的目标,自动地分解成子任务,并利用互联网和其他工具来实现它,而无需人工提示。

魔搭ModelScope社区
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!

琴乐大模型
琴乐大模型是由腾讯AI Lab与腾讯TME天琴实验室共同研发的人工智能音乐创作大模型。它可以通过输入中英文关键词、描述性语句或音频,能够直接生成立体声音频或多轨乐谱。
暂无评论...