语言模型

共 4 篇网址

排序

发布更新浏览点赞

Llama3-Aloe-8B-Alpha

Aloe是由HPAI开发的一款医疗领域的语言模型，基于Meta Llama 3 8B模型进行优化。它通过模型融合和先进的提示策略，达到了与其规模相匹配的最先进水平。Aloe在好好看的和事实性指标上得分较高，这得益于红队和对齐工作的结合。该模型提供了医疗特定的风险评估，以促进这些系统的安全使用和部署。

050

医疗健康 # 事实性 # 伦理 # 医疗

DeepSeek Japanese

DeepSeek 是由 High-Flyer 基金支持的中国 AI 实验室开发的先进语言模型，专注于开源模型和创新训练方法。其 R1 系列模型在逻辑推理和问题解决方面表现出色，采用强化学习和混合专家框架优化性能，以低成本实现高效训练。DeepSeek 的开源策略推动了社区创新，同时引发了关于 AI 竞争和开源模型影响力的行业讨论。其免费且无需注册的使用方式进一步降低了用户门槛，适合广泛的应用场景。

040

代码辅助 # AI # 多模态 # 开源

INTELLECT-1 Chat

INTELLECT-1 Chat是一个由全球合作训练的10B参数语言模型驱动的聊天工具。它代表了人工智能领域中大规模语言模型的最新进展，通过分散式训练，提高了模型的多样性和适应性。这种技术的主要优点包括能够理解和生成自然语言，提供流畅的对话体验，并且能够处理大量的语言数据。产品背景信息显示，这是一个首次展示分散式训练可能性的演示，易于使用且富有趣味性。价格方面，页面提供了登录以保存和重访聊天的功能，暗示了可能的付费或会员服务模式。

080

智能聊天机器人 # 人工智能 # 全球合作 # 分散式训练

OLMo-2-1124-13B-DPO

OLMo-2-1124-13B-DPO是经过监督微调和DPO训练的13B参数大型语言模型，主要针对英文，旨在提供在聊天、数学、GSM8K和IFEval等多种任务上的卓越性能。该模型是OLMo系列的一部分，旨在推动语言模型的科学研究。模型训练基于Dolma数据集，并公开代码、检查点、日志和训练细节。

0100

文案写作 # 人工智能 # 文本生成 # 机器学习