Gitpedia

Awesome pretrained chinese nlp models

Awesome Pretrained Chinese NLP Models,高质量中文预训练模型&大模型&多模态模型&大语言模型集合

From lonePatient·Updated May 30, 2026·View on GitHub·

在自然语言处理领域中,预训练语言模型(Pretrained Language Models)已成为非常重要的基础技术,本仓库主要收集目前网上公开的一些高质量中文预训练模型、中文多模态模型、中文大语言模型等内容(感谢分享资源的大佬),并将持续更新...... The project is written primarily in Python, distributed under the MIT License license, first published in 2019. It has gained significant community traction with 5,565 stars and 513 forks on GitHub. Key topics include: bert, chinese, dataset, ernie, gpt.

Awesome Pretrained Chinese NLP ModelsAwesome

<div align="center"> <a href="https://arxiv.org/pdf/2303.18223.pdf">论文: A Survey of Large Language Models</a> </div>

在自然语言处理领域中,预训练语言模型(Pretrained Language Models)已成为非常重要的基础技术,本仓库主要收集目前网上公开的一些高质量中文预训练模型、中文多模态模型、中文大语言模型等内容(感谢分享资源的大佬),并将持续更新......

国内下载HuggingFace仓库模型推荐使用HuggingFace镜像地址: https://hf-mirror.com/

📑 目录导航


📚 模型分类索引

🤖 大模型系列

分类说明链接
通用基础大模型参数 >7B 的基础语言模型查看
垂直基础大模型金融、医疗、法律等垂直领域查看
通用对话大模型对话式通用语言模型查看
垂直对话大模型垂直领域对话模型查看
多模态对话大模型图文等多模态模型查看
推理类大模型数学、逻辑推理模型查看

🔧 预训练模型系列

系列代表模型链接
NLU系列BERT · RoBERTa · ALBERT · ERNIE · MacBERT · ELECTRA查看全部 29 个
NLG系列GPT · GPT-3 · T5 · BART · CPM · RWKV查看全部 18 个
NLU-NLG系列UniLM · GLM · CPT · SimBERT查看全部 9 个
多模态系列WenLan · CogView · Chinese-CLIP · OFA查看全部 13 个

📦 资源与工具

📊 大模型评估基准 · 📦 开源模型库平台 · 📚 开源数据集库 · 📝 中文指令数据集 · 🎯 Embedding · 🔗 Other-Awesome


📌 备注说明

ND: Non-Causal Decoder (非因果解码器) | CD: Causal Decoder (因果解码器) | ED: Encoder-Decoder (编码器-解码器)


Base-LLM

大规模基础模型:表格中只罗列出参数量大于7B以上模型。查看完整列表 →

模型大小时间语言架构下载项目机构备注
XVERSE-MoE255B / A36B2024-09中英MoE🤗HFGitHubxverse-ai-
Qwen-2.50.5~72B (7档)2024-09中英CD🤗HFGitHubQwenLMBlog
Tele-FLM52B / 102B / 1TB2024-07多语CD🤗HF-CofeAIPaper
meta-llama-3.18B / 70B / 405B2024-07多语CD🤗HFGitHubmeta-llama-
internlm2.5-Base7B2024-07中英CD🤗HFGitHubInternLMTechnical Report

📋 查看全部 40+ 个模型请访问 Base-LLM 完整列表 →

<p align="right">[<a href="#top">Back to Top</a>]</p>

Domain-Base-LLM

各个垂直领域开源基础模型。查看完整列表 →

模型大小时间语言领域下载项目地址机构/个人架构文献备注
Qwen-2.51.5/7B2024-09中英代码🤗HFQwen2.5QwenLMCDBlog
Qwen-2.51.5/7/72B2024-09中英数学🤗HFQwen2.5QwenLMCDBlog
Tongyi-Finance-Base14B2023-11中文金融ModelScope通义金融-14B通义金融大模型CD
ChiMed-GPT13B2023-10中文医疗[🤗HF]ChiMed-GPT中国科学技术大学CDPaper
CodeShell-base7B2023-10中英代码[🤗HF]codeshellWisdomShellCD

📋 查看全部 13 个模型请访问 Domain-Base-LLM 完整列表 →

<p align="right">[<a href="#top">Back to Top</a>]</p>

ChatLLM

具备问答和对话等功能的大型语言模型。查看完整列表 →

模型大小时间架构下载项目
GLM-4.6A32/355B2025-10MoE🤗HFGLM-4.5
Ling-1T1T2025-10CD🤗HF/
Qwen3-NextA3/80B2025-09MoE🤗HFQwen3
Kimi-k2A32B/1T2025-08MoEHFKimi-K2
ERNIE-4.5A47/300B A3/21B2025-07MoE🤗HF/
Qwen-34/14/30/235B2025-05CD/MoE🤗HFQwen3
MiMo7B2025-05CD🤗HFMiMo
deepseek-v3671B2024-12MoE🤗HFDeepSeek-V3
Hunyuan-LargeA52/389B2024-11MoE🤗HFTencent-Hunyuan-Large
Qwen-2.50.5/1.5/3/7/14/32/72B2024-09CD🤗HFQwen2.5
MiniCPM34B2024-09CD🤗HFMiniCPM

📋 查看全部 180+ 个模型请访问 ChatLLM 完整列表 →

Domain-ChatLLM

各个垂直领域开源对话模型。查看完整列表 →

模型大小时间领域下载项目
Qwen3-Coder-Next/2026-02代码🤗HFQwen3
Skywork-SWE32B2025-06软件工程🤗HF/
Kimi-Dev/2025-06代码🤗HF/
Qwen3-Coder/2025-08代码🤗HFQwen3
DeepSeek-Coder-V2A21/236B2024-06代码🤗HFDeepSeek-Coder-V2
CodeGeeX49B2024-07代码🤗HFCodeGeeX4
Yi-Coder1.5/9B2024-09代码🤗HFYi-Coder
OpenCoder1.5/8B2024-11代码🤗HFOpenCoder

📋 查看全部 60+ 个模型请访问 Domain-ChatLLM 完整列表 →

MultiModal-ChatLLM

收集包含中文的多模态大模型,具备对话等功能。查看完整列表 →

模型大小时间领域下载项目
HY-World-2.01.2B2026-043D世界🤗HFHY-World-2.0
Gemma-4-ITE2B~31B2026-04通用🤗HF-
Qianfan-OCR4B2026-03文档🤗HFGitHub
AutoGLM-Phone9B2025-12Agent🤗HFOpen-AutoGLM
Dolphin-v23B2025-12文图🤗HFDolphin
DeepSeek-OCR3B2025-10文图🤗HFDeepSeek-OCR
Qwen-Image20B2025-08文图🤗HFQwen-Image
InternVL 2.52~78B2024-12文图🤗HFInternVL
Qwen2-VL2/7/72B2024-08图文视🤗HFQwen2-VL
MiniCPM-V 2.68B2024-08文图视🤗HFMiniCPM-V

📋 查看全部 90+ 个模型请访问 MultiModal-ChatLLM 完整列表 →

ReasoningLLM

收集推理能力比较突出的中文大模型。查看完整列表 →

模型大小时间架构下载项目
DeepSeek-V4-ProA49/1.6T2026-04MoE🤗HFDeepSeek-V4
MiMo-V2.5-ProA42/1.02T2026-04MoE🤗HFMiMo
Kimi-K2.6A32/1T2026-04MoE🤗HFKimi-K2.6
Qwen3.6A3/35B2026-04MoE🤗HFQwen3.6
DeepSeek-V3.2/2025-12MoE🤗HFDeepSeek-V3.2-Exp
QwQ-32B32B2025-03CD🤗HF/
DeepSeek-R1A37/671B2025-01MoE🤗HFDeepSeek-R1
MiniMax-M1A46/456B2025-06MoE🤗HFMiniMax-M1

📋 查看全部 50+ 个模型请访问 ReasoningLLM 完整列表 →

Embedding

MTEB排行榜: https://huggingface.co/spaces/mteb/leaderboard 镜像 查看完整列表 →

模型大小时间语言领域下载项目地址机构/个人
Qwen3-Embedding0.6/4/8B2025-06多语通用[🤗HF]Qwen3-EmbeddingQwenLMArxiv
JinaColBERT V2large2024-08多语通用[🤗HF]/Jina AIPaper
Conan-embedding-v1large2024-08中文通用[🤗HF]/TencentABCPaper
xiaobu-v2large2024-07中文通用[🤗HF]/lier007
zpoint_largeLarge2024-06中文通用[🤗HF]/yang

📋 查看全部 15 个模型请访问 Embedding 完整列表 →

大模型评估基准

1. C-Eval

C-Eval 是一个全面的中文基础模型评估套件。它包含了13948个多项选择题,涵盖了52个不同的学科和四个难度级别,查看论文了解更多细节。

[官方网站] [Github] [论文]

2. FlagEval

FlagEval是一个面向AI基础模型的评测工具包。我们的目标是探索和集合科学、公正、开放的基础模型评测基准、方法及工具,对多领域(如语言、语音、视觉及多模态)的基础模型进行多维度(如准确性、效率、鲁棒性等)的评测。我们希望通过对基础模型的评测,加深对基础模型的理解,促进相关的技术创新及产业应用。

[官方网站] [Github]

3. SuperCLUElyb

SuperCLUE琅琊榜,这是一个中文通用大模型对战评价基准,它以众包的方式提供匿名、随机的对战。在本文中,我们发布了初步的结果和基于Elo评级系统的排行榜,Elo评级是国际象棋和其他竞技游戏中广泛使用的评级系统。我们邀请整个社区加入这项工作,贡献新的模型,并通过提问和投票选出你最喜欢的答案来评估它们。

[官方网站] [Github]

4. XiezhiBenchmark

该基准包括来自13个不同学科的516个学科的220,000个多项选择题,以及15,000个来自单一学科和多个学科的问题。我们对47个最新的大型语言模型在Xiezhi上进行了评估,结果表明在科学、工程、农学、医学和艺术等领域,大型语言模型的表现超过了人类的平均水平,但在经济学、法学、教育学、文学、历史和管理学等领域,人类的表现仍然远远超过了大型语言模型。

[官方网站] [Github] [论文]

5. Open LLM Leaderboard

由HuggingFace组织的一个LLM评测榜单,目前已评估了较多主流的开源LLM模型,以英文为主。主要目标是跟踪、排名和评估最新的大语言模型和聊天机器人,让所有人方便的观察到开源社区的进展和评估这些模型。这个排行榜有一个关键优势,社区中的任何成员都可以提交模型,并在 Hugging Face 的 GPU 集群上自动评估。

[官方网站]

6. 中文大模型安全评测平台

大模型安全测评依托于一套系统的安全评测框架,涵盖了仇恨言论、偏见歧视言论、犯罪违法、隐私、伦理道德等八大类别,包括细粒度划分的40余个二级安全类别。

[官方网站] [Github] [论文]

7. OpenCompass大语言模型评测

OpenCompass 是一款开源、高效、全面的评测大模型体系及开放平台。我们提供完整开源可复现的评测框架,支持大语言模型、多模态模型各类模型的一站式评测。利用分布式技术,即使面对千亿参数模型也能在数小时内完成评测。基于多个不同维度的高认可度数据集开放多样化的评测方式,包括零样本评测、小样本评测和思维链评测,全方位量化模型各个维度能力。

[官方网站] [Github]

开源模型库平台

  1. 🤗HuggingFace: The AI community building the future.
  1. ModelScope: ModelScope平台是以模型为中心的模型开源社区
  1. flagopen: flagopen飞智大模型技术开源体系
  1. 始智AI: 中国AI开源创新社区

开源数据集库

  1. huggfaceing数据集仓库: https://huggingface.co/datasets
  • 包含了自然语言处理、计算机视觉、语音、多模态等数据集,内置100多个多语言公共数据集下载
  1. ModelScope数据集仓库:https://modelscope.cn/datasets
  • 提供了覆盖自然语言处理、计算机视觉、语音、多模态等数据集,更有阿里巴巴集团贡献的专业领域数据集,
  1. flagopen数据集仓库: https://data.baai.ac.cn/data
  • 内置公共数据集下载,可下200G大规模预训练语料WuDaoCorpora
  1. cluebenchmarks数据集仓库:https://www.cluebenchmarks.com/dataSet_search.html
  • 多个中英文NLP数据集,并可申请下载100GB的高质量中文预训练语料CLUECorpus2020
  1. MNBVC: Massive Never-ending BT Vast Chinese corpus
  • 超大规模中文语料集
  1. OpenDataLab数据集仓库: https://opendatalab.com/
  • OpenDataLab 是有影响力的数据开源开放平台,公开数据集触手可及。
  1. OSCAR: Open Super-large Crawled Aggregated coRpus, 多语言数据集
  • 最新版本包含1.4T的中文语言数据集

🔧 预训练模型系列

中文预训练语言模型系列,涵盖 NLU、NLG、NLU-NLG 和多模态四大类。

系列说明代表模型详情
NLU系列自然语言理解BERT · RoBERTa · ALBERT · ERNIE · MacBERT · ELECTRA 等 29 个查看完整列表 →
NLG系列自然语言生成GPT · GPT-3 · T5 · BART · CPM · RWKV 等 18 个查看完整列表 →
NLU-NLG系列理解与生成UniLM · GLM · CPT · SimBERT 等 9 个查看完整列表 →
多模态系列多模态预训练WenLan · CogView · Chinese-CLIP · OFA 等 13 个查看完整列表 →

Other-Awesome

其他优质 Awesome 资源列表

名称说明作者/组织地址
Awesome-OPD使用 On-Policy Distillation (OPD) 和 On-Policy Self-Distillation (OPSD) 训练 LLM/VLM/Agent/Draft Model 的开源仓库和论文精选列表thinkweeGitHub
Awesome-Claude-SkillsClaude技能、资源和工具ComposioHQGitHub
Awesome-Claude-CodeClaude Code相关技能和工具hesreallyhimGitHub
Awesome-OpenClaw-SkillsOpenClaw社区构建的技能VoltAgentGitHub
Awesome-Agents开源AI Agent工具和产品kyrolabsGitHub

查看完整列表(共 52 个)→

更新

📋 查看完整更新日志请访问 更新日志 →

Contributors

<a href="https://github.com/eryajf/learn-github/graphs/contributors"> <img src="https://contrib.rocks/image?repo=lonePatient/awesome-pretrained-chinese-nlp-models" /> </a>

Misc

↳ Stargazers

Stargazers repo roster for

↳ Forkers

Forkers repo roster for

↳ Star History

<div align="center"> [![Star History Chart](https://api.star-history.com/svg?repos=lonePatient/awesome-pretrained-chinese-nlp-models&type=Date)](https://star-history.com/#lonePatient/awesome-pretrained-chinese-nlp-models&Date) </div>

Visitor Count

Contributors

Showing top 7 contributors by commit count.

View all contributors on GitHub →

This article is auto-generated from lonePatient/awesome-pretrained-chinese-nlp-models via the GitHub API.Last fetched: 6/1/2026