Darwin是一个开源项目,专注于自然科学领域的大型语言模型构建,主要涵盖物理、化学和材料科学。通过对科学文献和数据集进行预训练和微调,Darwin 在科学问答和多任务学习任务中表现优异。它结合了结构化和非结构化的科学知识,提升了语言模型在科学研究中的效能。Darwin 提供了一种强大的工具,助力科学家和研究人员在科学发现中取得更大突破。 Darwin:面向自然科学的开源语言模型 Darwin的主要功能特点 高性能:Darwin 的微调策略(QA + 多任务)显著提升了其在多样化机器学习任务中的表现,使其成为一个竞争力强的模型,能够在科学问答和多任务学习任务中超越现有的许多机器学习方法。 数据策略:Darwin 结合科学文献和 FAIR 数据集,生成高质量的科学指令和问答数据。通过混合 QA 数据和通用数据,提升了模型的性能,同时避免了模型退化。 模型评估:通过与其他模型的广泛比较,Darwin 在少样本学习任务中表现优异,甚至超过了 GPT-4。在实验带隙预测任务和金属分类任务中,Darwin 达到了 SOTA(state-of-the-art)水平。 同步数据和格式匹配:测试了目标任务的同步(sync)数据,发现同步数据的相似格式显著提升了性能,而不同格式的同步数据则会降低性能。 专有模型的微调:成功在未预训练的 LLaMA 架构上应用了监督微调(SFT),证明了模型可以通过微调有效地获得领域特定知识。 直接与 LLaMA 变体比较:对 LLaMA1、LLaMA2、LLaMA3 和 LLaMA3.1 模型进行了广泛的比较,发现 LLaMA1 的 QA + 多任务微调策略表现最好,超过了其他所有变体。 开放性和协作性:Darwin 是一个开源项目,鼓励用户参与改进和发展。项目主要面向自然科学领域,特别是材料科学、化学和物理学。 Darwin模型的最新版本Darwin 1.5,进一步增强了其在材料科学领域的应用能力。该版本整合了更丰富的科学问答数据和材料科学任务,提升了模型在材料属性预测和发现方面的准确性和效率。此外,Darwin 1.5采用了语言接口微调框架(LIFT),使得模型在处理复杂科学问题时更加高效和灵活。 在实际应用中,Darwin模型不仅限于材料设计,还可以用于药物研发、疾病诊断等生物医学领域,展现出其跨学科的潜力。通过与科学文献和数据集的深度整合,Darwin模型能够为研究人员提供更为精准的科学支持,推动科学发现的进程。 Darwin模型由新南威尔士大学(UNSW)ai4Science与GreenDynamics AI合作开发,是一个开源项目,专注于预训练和微调LLaMA模型,以增强其在科学领域的表现。其核心目标是通过人工智能驱动的自动化方法,加速科学发现过程,减少对闭源AI模型的依赖。 Darwin代码库:https://github.com/masterai-eam/darwin
数据统计
相关导航
Step-Video-T2V 是由阶跃星辰与吉利汽车集团 联合开源的一款先进文本生成视频(Text-to-Video)模型。这款模型在 2025 年 2 月 18 日正式发布,具备强大的多模态生成能力,支持中文和英文输入,适用于广告、影视制作、教育等多个场景。
YAYI2
YAYI2(雅意2)是中科闻歌推出的新一代开源大语言模型,支持中文、英语等 10 多种语言。基于 Transformer 架构,参数规模达到 30B。YAYI2 采用 2 万亿 Tokens 的高质量语料进行预训练,并结合人类反馈强化学习,确保模型与人类价值观对齐。其多模态交互功能支持图文互生成、PDF 解析等。YAYI2 广泛应用于媒体宣传、舆情分析、政务治理、金融分析等领域,为企业提供 AI 辅助工具和知识库问答系统。
CrewAI
CrewAI是一个创新的框架,专为角色扮演中的AI代理提供自动化设置。它通过促进AI代理之间的合作,使得这些代理能够共同解决复杂问题。CrewAI的核心特征包括角色定制代理、自动任务委派、任务管理灵活性和流程导向。它既可以使用OpenAI的API,也可以通过Ollama使用本地的大模型来运行程序。
JoyGen
JoyGen是一个音频驱动的3D深度感知说话人脸视频生成框架。它通过音频驱动生成嘴唇运动和视觉外观合成,旨在实现精确的嘴唇-音频同步和高视觉质量。
RMBG-2.0
RMBG-2.0是由BRIA AI 开发的开源图像背景移除模型,通过先进的卷积神经网络(CNN)实现高精度的前景与背景分离。该模型在经过精心挑选的数据集(包括一般图像、电子商务、游戏和广告内容)上进行了训练,专为大规模企业内容创建的商业用例设计,其准确性、效率和多功能性可以媲美领先的 Source Available 型号。
灵境矩阵
灵境矩阵是百度推出的一个基于文心大模型的智能体(Agent)平台。它支持开发者根据自己的行业领域和应用场景,选择不同的开发方式来构建产品,以适应大模型时代的需求。开发者可以通过低成本的prompt编排方式来开发智能体,同时平台还提供了流量分发路径,帮助开发者完成商业闭环。
讯飞星火大模型
讯飞星火大模型是科大讯飞发布的一个基于深度学习的自然语言处理模型,以中文为核心,具备跨领域多任务上的类人理解和生成能力。注册免费领取1500万Tokens,该模型对标ChatGPT,并在多个领域表现出色。
商汤日日新大模型
商汤日日新大模型体系
暂无评论...
