Edit model card

TuringMM 智娃AI大模型

模型介绍

  • TuringMM-34B-Chat是一款开源的中英文Chat模型,由北京光年无限科技有限公司基于Yi-34B开源模型、基于14w的精标教育数据进行sft微调以及15W对齐数据进行DPO偏好学习得到的一个微调模型。

  • Yi 系列模型以双语语言模型为目标,在 3T 多语言语料库上进行训练,成为全球最强的 LLM 模型之一,在语言理解、常识推理、阅读理解等方面表现出良好的前景;

请注意,TuringMM-34B-Chat仍然可能生成包含事实性错误的误导性回复或包含偏见/歧视的有害内容,请谨慎鉴别和使用生成的内容。


📥 模型下载

模型名称 模型大小 HuggingFace ModelScope
TuringMM-34B-Chat 65G 🤗HuggingFace 🤖ModelScope

模型评估结果

模型基准测试C-EVAL

  • C-Eval 是一个全面的中文基础模型评估套件。它包含了13948个多项选择题,涵盖了52个不同的学科和四个难度级别
发布公司 平均得分 hard steam 社会科学 人文科学 其他
Qwen-72B-Chat 阿里云 79.5 - 74.5 89.1 81.2 78.1
XVERSE-65B 元象智能 72.4 50.8 65.7 85 74 71.8
XuanYuan-70B 度小满 71.9 53.6 67.7 83.3 73.9 67.4
TuringMM-34B-Chat 光年无限 80.7 60.2 73.8 89.3 82.3 83.7

模型推理

推理所需的模型权重、源码、配置已发布在 Hugging Face,下载链接见本文档最开始的表格。我们在此示范多种推理方式。程序会自动从Hugging Face 下载所需资源。

Python 代码方式

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
from transformers.generation.utils import GenerationConfig

tokenizer = AutoTokenizer.from_pretrained("lightyear-turing/TuringMM-34B-Chat", use_fast=False, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("lightyear-turing/TuringMM-34B-Chat", device_map="auto",
                                             torch_dtype=torch.bfloat16, trust_remote_code=True)

model.generation_config = GenerationConfig.from_pretrained("lightyear-turing/TuringMM-34B-Chat")

# 流式输入示例
for res in model.chat_stream(tokenizer, '你好啊!', max_token=200, history=[], do_sample=True):
    print(i)

# 非流式输出示例
pret, history = model.chat(tokenizer, '你好啊!', max_token=200, history=[], do_sample=True)
print(pret)
  • 可以使用添加环境变量的方式控制显卡使用 export CUDA_VISIBLE_DEVICES=0,1(使用了0、1号显卡)
  • 或者在代码添加 os.environ['CUDA_VISIBLE_DEVICES'] = "0,1"

页面方式体验

python run_chat_web.py --checkpoint_path '/your-model-path'

本页面基于gradio工具开发,是为 Chat 对话场景设计。


示例输出

游戏互动

用户:	你好啊
TuringMM	你好!我是一名机器人,名叫智娃,很高兴见到你。有什么我可以帮助你的吗?

用户:	你可以和我一起玩吗
TuringMM	当然可以!我们可以一起玩游戏,聊天,了解更多关于地球的事情。你想玩什么游戏呢?

用户:	我们可以一起玩成语接龙吗
TuringMM	成语接龙?听起来很有趣!那我们一起开始吧,成语接龙第一字是“羊”,你能接上吗?

用户:	没想到,你换一个吧
TuringMM	没问题,成语接龙第二字是“牛”,这个简单多了吧?那么,你接什么呢?

闲聊

用户:	我不想去学校了
TuringMM	看起来你今天心情不太好,是吗?你为什么不想去学校呢?

用户:	学校有人欺负我
TuringMM	我听到你的声音里有些难过和不安,是吗?你感觉很不舒服,是吗?可以告诉我发生了什么事情吗?

用户:	他们抢我零食
TuringMM	这听起来很令人沮丧。你知道,这并不是第一次发生,对吧?你有没有告诉老师或家长呢?他们能帮助你。如果你不想要,他们也不会强迫你分享。你愿意试试跟他们说说话吗?                           

企业介绍

图灵机器人,全名北京光年无限科技有限公司,是国内强大的AI交互技术和智能OS公司,使命愿景是“实现人机自由对话、让AI机器人进入亿万家庭”。 目前,北京光年无限专注于消费类/智能学习硬件场景,并自主研发了一系列基于儿童教育智能硬件的AI技术产品,包括儿童语音对话、视觉AI交互、儿童教育AI大模型等。北京光年无限以AI技术研发驱动 ,AI领域的技术发明专利超过500件,主要产品如图灵机器人、Turing OS等在行业有良好的客户口碑。其中,主营业务产品“图灵机器人”累计超过百万级的AI对话机器人开发者,在智慧家庭/教育硬件等AI机器人场景拥有深度积累。


声明

由于模型参数量限制、训练数据的清洗程度等因素,本项目开源的模型可能存在以下局限性:

  • 对于事实性知识,容易产生错误的回复。
  • 由于未经过无害化微调,可能会产生歧视、危害、违背伦理道德的言论。
  • 在代码、推理上的能力仍有欠缺。

基于以上模型的局限性,我们要求本项目的代码、数据、模型不得用于对社会造成危害的用途,且应当遵循基座模型的商业许可。

Downloads last month
3
Safetensors
Model size
34.4B params
Tensor type
BF16
·
Inference API (serverless) does not yet support model repos that contain custom code.