
Darwin是一个开源项目,专注于自然科学领域的大型语言模型构建,主要涵盖物理、化学和材料科学。通过对科学文献和数据集进行预训练和微调,Darwin 在科学问答和多任务学习任务中表现优异。它结合了结构化和非结构化的科学知识,提升了语言模型在科学研究中的效能。Darwin 提供了一种强大的工具,助力科学家和研究人员在科学发现中取得更大突破。 Darwin:面向自然科学的开源语言模型 Darwin的主要功能特点 高性能:Darwin 的微调策略(QA + 多任务)显著提升了其在多样化机器学习任务中的表现,使其成为一个竞争力强的模型,能够在科学问答和多任务学习任务中超越现有的许多机器学习方法。 数据策略:Darwin 结合科学文献和 FAIR 数据集,生成高质量的科学指令和问答数据。通过混合 QA 数据和通用数据,提升了模型的性能,同时避免了模型退化。 模型评估:通过与其他模型的广泛比较,Darwin 在少样本学习任务中表现优异,甚至超过了 GPT-4。在实验带隙预测任务和金属分类任务中,Darwin 达到了 SOTA(state-of-the-art)水平。 同步数据和格式匹配:测试了目标任务的同步(sync)数据,发现同步数据的相似格式显著提升了性能,而不同格式的同步数据则会降低性能。 专有模型的微调:成功在未预训练的 LLaMA 架构上应用了监督微调(SFT),证明了模型可以通过微调有效地获得领域特定知识。 直接与 LLaMA 变体比较:对 LLaMA1、LLaMA2、LLaMA3 和 LLaMA3.1 模型进行了广泛的比较,发现 LLaMA1 的 QA + 多任务微调策略表现最好,超过了其他所有变体。 开放性和协作性:Darwin 是一个开源项目,鼓励用户参与改进和发展。项目主要面向自然科学领域,特别是材料科学、化学和物理学。 Darwin模型的最新版本Darwin 1.5,进一步增强了其在材料科学领域的应用能力。该版本整合了更丰富的科学问答数据和材料科学任务,提升了模型在材料属性预测和发现方面的准确性和效率。此外,Darwin 1.5采用了语言接口微调框架(LIFT),使得模型在处理复杂科学问题时更加高效和灵活。 在实际应用中,Darwin模型不仅限于材料设计,还可以用于药物研发、疾病诊断等生物医学领域,展现出其跨学科的潜力。通过与科学文献和数据集的深度整合,Darwin模型能够为研究人员提供更为精准的科学支持,推动科学发现的进程。 Darwin模型由新南威尔士大学(UNSW)ai4Science与GreenDynamics AI合作开发,是一个开源项目,专注于预训练和微调LLaMA模型,以增强其在科学领域的表现。其核心目标是通过人工智能驱动的自动化方法,加速科学发现过程,减少对闭源AI模型的依赖。 Darwin代码库:https://github.com/masterai-eam/darwin
数据统计
相关导航

VISION XL 是一款专注于解决视频逆问题的超高清视频修复工具。利用潜在图像扩散模型,VISION XL 高效处理视频去模糊、超分辨率和修复等任务,显著提升视频清晰度。支持多种降质形式和高分辨率重建,保证时间一致性。适用于视频修复、去模糊和超分辨率增强,让用户轻松实现高清视频的清晰化处理。

GPT-4
GPT-4是OpenAI开发的最新一代大型语言模型。它能够接受文本和图像输入,生成类似人类的文本输出。它还能处理长达2.5万字的内容,是ChatGPT的8倍以上,使其在生成文本、延伸对话或分析文件方面更加强大。GPT-4还具备分析图像的能力,能够识别图片中的元素并生成相关的文本。

Etna模型
Etna大模型是七火山科技推出的一个文生视频的AIGC模型,它能够根据简短的文本描述生成相应的视频内容。七火山科技发布的Etna文生视频模型支持生成视频时长达到8~15秒,每秒可达60帧,分辨率最高可达4K(3840*2160),画面细腻逼真。

PixelDance
PixelDance是由字节跳动开发的一款高动态视频生成模型,它能够根据用户提供的图片和文本描述来生成具有复杂场景和动态效果的视频。这项技术特别在于它结合了图像指令(针对视频片段的首尾帧)和文本指令,使得生成的视频不仅视觉上丰富,而且动作细节丰富,能够展现出高度的动态性。

可灵大模型
可灵大模型是快手AI团队自研的一款视频生成大模型,采用类似Sora的技术路线,能够生成符合物理规律的大幅度运动视频,模拟真实世界的特性。支持生成长达2分钟的30fps的超长视频,分辨率高达1080p,且支持多种宽高比。2024年6月,快手正式推出了可灵大模型,并在快影App开放邀测体验。

NineF AI
NineF AI 是一站式免费主流 AI 大模型集成平台,集成了 GPT、Claude、Llama 等全球顶尖 AI 模型,提供多角度智能解答,助您提升工作效率和决策准确性。界面简洁直观,支持图片和文档上传,满足各类创作和研究需求,是激发创新灵感的理想人工智能助手。

腾讯混元DiT
腾讯混元DiT是一个基于Diffusion transformer的文本到图像生成模型,也是业内首个中文原生的DiT架构文生图开源模型。该模型具有中英文细粒度理解能力,能够与用户进行多轮对话,根据上下文生成并完善图像。

悟道大模型
悟道大模型是由北京智源人工智能研究院发起的超大规模预训练模型研究项目,不仅具备强大的语言理解和生成能力,还能进行逻辑推理、代码分析、图像生成等多种任务,支持多种类型的文本内容生成,如小说、歌词、诗歌、对联等。
暂无评论...