GitPedia

Poetry

非常全的古诗词数据,收录了从先秦到现代的共计85万余首古诗词。

From Werneror·Updated June 26, 2026·View on GitHub·

古诗词数据按朝代存储在多个 CSV 文件中,以避免单个文件过大。有 `题目`、`朝代`、`作者` 和 `内容` 四个字段。 The project is written primarily in Python, distributed under the MIT License license, first published in 2018. It has gained significant community traction with 1,748 stars and 422 forks on GitHub. Key topics include: chinese, chinese-poetry, csv, data, poetry.

Poetry

非常全的古诗词数据,收录了从先秦到现代的共计 85 万余首古诗词。

统计信息

朝代诗词数作者数
2871149446
2369574439
900898872
491952736
373751209
近现代28419790
当代28219177
明末清初17700176
元末明初1573679
清末民国初1536799
清末近现代初1246448
宋末元初1205841
南北朝4586434
近现代末当代初342623
魏晋3020251
金末元初301917
2741253
民国末当代初19489
117084
唐末宋初111844
先秦5708
隋末唐初47240
36383
宋末金初2349
227
22
魏晋末南北朝初11
总和85338529377

数据说明

古诗词数据按朝代存储在多个 CSV 文件中,以避免单个文件过大。有 题目朝代作者内容 四个字段。

古诗词中有一些生僻字,属于 utf8mb4 字符,在许多设备中无法显示,使用 ? 替代。

导入数据库

为方便导入,将多个 CSV 文件合并成一个。这通过执行如下命令实现:

shell
python scripts/merge.py

该命令将在当前目录下生成 poetry.csv 文件。

MySQL 8

创建数据库:

sql
CREATE DATABASE poetry CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;

创建数据表:

sql
use poetry; CREATE TABLE `poetry` ( `id` int(11) NOT NULL AUTO_INCREMENT, `title` char(200) DEFAULT NULL, `dynasty` char(50) DEFAULT NULL, `author` char(100) DEFAULT NULL, `content` text, PRIMARY KEY (`id`) );

查看 secure_file_priv 设置:

sql
SHOW variables like '%secure_file_priv%';

结果类似于:

sql
+------------------+------------------------------------------------+ | Variable_name | Value | +------------------+------------------------------------------------+ | secure_file_priv | C:\ProgramData\MySQL\MySQL Server 8.0\Uploads\ | +------------------+------------------------------------------------+ 1 row in set, 1 warning (0.0014 sec)

该目录可能因环境不同而不同。若 secure_file_privValue 为空,请自行搜索如何设置。

poetry.csv 文件复制到 secure_file_priv 目录中,Windows 用户可参考如下命令:

shell
copy poetry.csv "C:\ProgramData\MySQL\MySQL Server 8.0\Uploads"

从 CSV 文件中导入数据:

sql
LOAD DATA INFILE 'C:\\ProgramData\\MySQL\\MySQL Server 8.0\\Uploads\\poetry.csv' INTO TABLE `poetry` FIELDS TERMINATED BY ',' ENCLOSED BY '"' LINES TERMINATED BY '\r\n' (title, dynasty, author, content);

License

MIT 许可证。

Contributors

Showing top 2 contributors by commit count.

View all contributors on GitHub →

This article is auto-generated from Werneror/Poetry via the GitHub API.Last fetched: 6/27/2026