
书生通用大模型是由上海人工智能实验室与商汤科技联合发布的大型预训练模型。它包括多个基础模型,如书生·多模态、书生·浦语和书生·天际等。这些模型旨在支持科研创新和产业应用,提供一个全链条开源的研发与应用平台。书生通用大模型体系的目标是构建一个通用视觉技术体系,帮助开发者快速降低通用视觉模型开发门槛。 此外,书生·视觉大模型(InternVL)是该体系的一部分,它在视觉核心任务上取得了开源领先的性能。例如,InternVL-6B具有60亿参数量,并能够在纯视觉任务和图生文任务上逼近或超过谷歌闭源ViT-22B2。这些模型不仅能够处理复杂图片中细微的视觉信息,还可以识别和解读复杂页面中的信息,甚至解决其中的数理问题。 书生通用大模型官网界面 书生通用大模型的主要功能 1、全链条开源:提供从数据到预训练、微调、部署和评测的全链条开源体系,支持学术研究和产业应用。 2、多模态能力:支持光标指令交互、利用语言定义任意任务和轻量级自适应融合等关键技术,实现开放世界理解、多模态交互和跨模态生成。 3、高性能参数量:例如,书生·浦语语言大模型的104B版高质量语料从1.6万亿token增至了1.8万亿,语境窗口长度从2K增至了8K,支持20多种语言。 4、广泛的应用领域:已实现对城市实景建模、自动驾驶、智慧医疗、气象预报等领域的智能化进程。 5、可编程的通用工具调用能力:在复杂任务上,模型可以自动编写一段Python程序,综合调用多种能力,大幅拓展模型能力。 应用场景 自动驾驶:通过模型的高性能参数量和多模态能力,可以实现更加智能的自动驾驶系统,提高安全性和效率。 智慧医疗:在医疗领域,书生通用大模型可以帮助进行诊断、治疗建议和患者管理,推动智慧医疗的发展。 气象预报:该模型可以用于气象数据分析,提高气象预报的准确性和可靠性,对于灾害预防和应对具有重要意义。 城市实景建模:书生通用大模型支持创建高精度的城市实景建模,这对于城市规划、交通管理和环境保护等领域都有应用价值。 多语言支持:该模型支持20多种语言,可以在全球范围内应用,特别是在需要跨语言交流的国际合作中非常有帮助。
数据统计
相关导航

StereoCrafter是腾讯AI实验室开发的一款开源框架,能够将普通的 2D 视频转换为沉浸式的 3D 视频。通过深度估计和立体视频修复技术,StereoCrafter 提供高质量的 3D 视频生成,支持多种视频源,包括电影、视频博客、3D 动画和 AI 生成内容。

TangoFlux
TANGOFLUX是一个高效的文本转音频(TTA)生成模型,拥有 515M 参数,能够在单个 A40 GPU 上仅需 3.7 秒生成长达 30 秒的 44.1kHz 立体声音频,TangoFlux不仅可以生成音效如鸟叫、口哨、爆炸等声音,还能生成音乐。

CrewAI
CrewAI是一个创新的框架,专为角色扮演中的AI代理提供自动化设置。它通过促进AI代理之间的合作,使得这些代理能够共同解决复杂问题。CrewAI的核心特征包括角色定制代理、自动任务委派、任务管理灵活性和流程导向。它既可以使用OpenAI的API,也可以通过Ollama使用本地的大模型来运行程序。

讯飞开放平台
讯飞开放平台,一个领先的人工智能技术与生态服务平台,致力于为开发者与企业提供全面的智能交互能力。我们不仅提供语音、图像、自然语言识别等核心交互技术,还拥有丰富的行业解决方案与SaaS产品,助力您轻松构建各类智能应用。

星流图像大模型
星流图像大模型由 LiblibAI 发布的一款自研图像大模型,名为 Star-3 Alpha。该模型基于业界领先的 F.1 基础算法架构训练而成,辅以全球最大的 LORA 增强模型库及不断进化的 AI 图像控制能力。在图像精准度、色彩表现力、美学捕捉的细腻表达等方面实现了显著的飞跃,成为新的业界标杆。

ReSyncer
ReSyncer 是由清华大学、百度和南洋理工大学 S-Lab 实验室联合开发的多功能 AI 框架,专注于视频合成技术。它能够生成与音频高度同步的逼真口型视频,支持个性化调整、视频驱动口型同步、说话风格迁移和人脸交换。ReSyncer 在创建虚拟主持人、电影配音和多语言内容制作等领域具有广泛应用前景。

Sora
Sora是一个能以文本描述生成视频的人工智能模型,由美国人工智能研究机构OpenAI开发。它能够根据用户的文本描述生成长达 60 秒、1080P 高质量视频,其中包含精细复杂的场景、生动的角色表情以及复杂的镜头运动。并在单个生成视频中创建多个镜头,准确保留角色和视觉风格。

Phantom
Phantom是由字节跳动推出的一款创新视频生成框架,专注于主体一致性的视频生成任务(Subject-to-Video, S2V)。它通过跨模态对齐技术,将文本和图像提示结合起来,从参考图像中提取主体元素,并生成与文本描述一致的视频内容。
暂无评论...