当前位置:返回首页

清华北航博士生「强迫」Gemma-2说中文！弱智吧、角色扮演、数学问题表现惊喜

日期：2024-07-07 来源：原创/投稿/转载浏览次数：67

　　谷歌的 Gemma 2 刚刚发布，清华和北航的两名博士生就已经成功推出了指令微调版本，显着增强了 Gemma 2 9B / 27B 模型的中文通用对话、角色扮演、数学、工具使用等能力。

　　众所周知，很多国外 LLM 一直存在非英语歧视问题，英语和其他语言在 LLM 中存在的性能差距有时可以用悬殊来形容。

　　之前就有网友发现，GPT-4o 分词器语料库中，中文数据污染非常严重，赌博色情网站是一个也不少，严重影响了我们用中文和 AI 机器人好好聊天。

　　最近发布的 Gemma 2 模型虽然既开源又强悍，但比较遗憾的是，其中文水平相较英文水平还有一定的距离。

　　更让人惊喜的是，1 天之后，27B 的微调版本也上线了。根据 HuggingFace 主页信息，模型的下载量已经超过了 3.4 万。

　　项目介绍显示，采用的微调算法是 ORPO，ORPO 将监督微调（SFT）和 RLHF 或 DPO 等偏好对齐方法合二为一，是一种非常聪明的算法。

　　与原来的 9B Gemma 2 模型相比，微调的 Gemma-2-9B-Chinese-Chat 模型大大减少了「中文问题英文回答」和「中英文混杂回答」的问题，在角色扮演、工具使用和数学方面的表现都有所提高。

　　但小编用在线 demo 亲自尝试了一下，发现这位鲁智深「粗鲁」不起来，目前还没有很好的连续性。

　　弱智吧的各种文字游戏，是 NLP 程序员最讨厌的，但微调模型在处理弱智吧的一些言论时，似乎表现还不错。

　　人工智能（AI）是计算机科学的一个分支，它专注于创造能够执行复杂任务的智能机器。AI 的目的是创建能够学习、解决问题和理解自然语言的系统。人工智能的应用非常广泛，包括图像识别、语音助手、推荐系统、自动驾驶汽车和预测性维护等。

　　AI 技术可以分为几个不同的类别，包括机器学习、深度学习和自然语言处理。机器学习是人工智能的一个分支，它专注于创建能够从数据中学习和做出预测的算法。深度学习是机器学习的一个子集，它使用人工神经网络来模拟人类大脑的功能。

　　AI 在医疗保健、金融、运输和零售等多个行业都有广泛的应用。在医疗保健领域，AI 正在帮助医生诊断疾病、预测患者护理需求以及个性化治疗计划。在金融服务行业，AI 正在用于欺诈检测、风险管理和个性化投资建议。

　　AI 在提高效率、减少成本并推动创新方面有着巨大的潜力。然而，AI 也带来了挑战，包括就业的流失、隐私问题以及伦理考虑。随着 AI 技术的快速发展，各国政府和组织正在制定新的法律和法规来应对这些挑战。

　　总之，人工智能是当今世界最激动人心的创新之一。随着 AI 技术的不断进步，它有潜力彻底改变我们的工作方式、生活方式和社会结构。然而，AI 也提出了新的伦理和社会问题，这些问题需要我们仔细考虑。

　　王慎执同学是清华大学自动化系 LEAP 实验室的三年级博士生，导师是宋士吉教授和黄高副教授。

　　郑耀威目前仍在北航读博，他曾以第一作者在 CVPR、AAAI、等顶会发表多篇论文，并担任 AAAI、EMNLP、Neural Computation 等会议和期刊审稿人。

　　他也是大模型微调框架 LLaMA Factory 的发起人和主要开发者，GitHub 开源项目获得超过 2 万星标。

　　广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

关键字：

上一篇：北信源(300352)_股票价格_行情_走势图—东方财富网下一篇：你的SIM卡设密码了吗？这些事要知道

推荐阅读

本网转载作品的目的在于传递更多信息，涉及作品内容、

版权等问题，请联系我们进行修改或删除！

欢迎访问！