Skip to content
Please note that GitHub no longer supports your web browser.

We recommend upgrading to the latest Google Chrome or Firefox.

Learn more
汉字转拼音(pypinyin)
Python Makefile
Branch: master
Clone or download
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
.circleci remove coveralls Dec 2, 2018
.github 更新开发文档地址 Dec 8, 2018
docs 更新 usage ,删除重复的示例 Apr 6, 2019
phrase-pinyin-data @ 336026d 使用 `phrase-pinyin-data`_ v0.10.1 的词语拼音数据 Fixed #174 Jul 13, 2019
pinyin-data @ dcec679 使用 `phrase-pinyin-data`_ v0.10.1 的词语拼音数据 Fixed #174 Jul 13, 2019
pypinyin Bump version: 0.35.3 → 0.35.4 Jul 13, 2019
tests 修复 m̄ ê̄ ế ê̌ ề 这几个音无法转换为不含声调结果的问题 Jul 13, 2019
.appveyor.yml
.bumpversion.cfg Bump version: 0.35.3 → 0.35.4 Jul 13, 2019
.coveragerc
.editorconfig Added ISSUE_TEMPLATE and PULL_REQUEST_TEMPLATE Oct 28, 2017
.gitignore Use pytest-random-order instead of pytest-random Apr 15, 2018
.gitmodules 改为使用来自 phrase-pinyin-data 的词语拼音数据 Mar 12, 2017
.pre-commit-config.yaml 使用最新 v2.0.0 版本的 pre-commit Nov 3, 2018
CHANGELOG.rst v0.35.4 Jul 13, 2019
CODE_OF_CONDUCT.md adding a Code of Conduct Jun 15, 2017
LICENSE.txt 🌟 Happy New Year 🌟 Jan 2, 2016
MANIFEST.in Add py.typed marker Jun 10, 2018
Makefile 增加开发文档 Dec 2, 2018
README.rst 增加 TOC May 10, 2019
README_ru.rst test on python 3.6 Feb 12, 2017
gen_phrases_dict.py fix flake8 lint on python 3.7 Feb 24, 2019
gen_pinyin_dict.py fix flake8 lint on python 3.7 Feb 24, 2019
pytest.ini 更新文档和测试 Apr 22, 2018
requirements_dev.txt 改为使用 twine 上传文件到 PyPI Apr 22, 2018
setup.cfg wheel -> bdist_wheel Apr 10, 2017
setup.py 配置使用 CircleCI,不再测试 Python 2.6 和 Python 3.3,增加测试 PyPy3 Aug 5, 2018
tox.ini fix old python ci Feb 24, 2019

README.rst

汉字拼音转换工具(Python 版)

Build appveyor Coverage PyPI version DOI

将汉字转为拼音。可以用于汉字注音、排序、检索(Russian translation) 。

基于 hotoo/pinyin 开发。

特性

  • 根据词组智能匹配最正确的拼音。
  • 支持多音字。
  • 简单的繁体支持, 注音支持。
  • 支持多种不同拼音/注音风格。

安装

$ pip install pypinyin

使用示例

Python 3(Python 2 下把 '中心' 替换为 u'中心' 即可):

>>> from pypinyin import pinyin, lazy_pinyin, Style
>>> pinyin('中心')
[['zhōng'], ['xīn']]
>>> pinyin('中心', heteronym=True)  # 启用多音字模式
[['zhōng', 'zhòng'], ['xīn']]
>>> pinyin('中心', style=Style.FIRST_LETTER)  # 设置拼音风格
[['z'], ['x']]
>>> pinyin('中心', style=Style.TONE2, heteronym=True)
[['zho1ng', 'zho4ng'], ['xi1n']]
>>> pinyin('中心', style=Style.BOPOMOFO)  # 注音风格
[['ㄓㄨㄥ'], ['ㄒㄧㄣ']]
>>> pinyin('中心', style=Style.CYRILLIC)  # 俄语字母风格
[['чжун1'], ['синь1']]
>>> lazy_pinyin('中心')  # 不考虑多音字的情况
['zhong', 'xin']

注意事项

  • 拼音结果不会标明哪个韵母是轻声,轻声的韵母没有声调或数字标识。
  • 无声调相关拼音风格下的结果会使用 v 表示 ü

命令行工具:

$ pypinyin 音乐
yīn yuè
$ pypinyin -h

文档

详细文档请访问:http://pypinyin.rtfd.io/

项目代码开发方面的问题可以看看 开发文档

FAQ

词语中的多音字拼音有误?

目前是通过词组拼音库的方式来解决多音字问题的。如果出现拼音有误的情况, 可以自定义词组拼音来调整词语中的拼音:

>>> from pypinyin import Style, pinyin, load_phrases_dict
>>> pinyin('步履蹒跚')
[[''], [''], ['mán'], ['shān']]
>>> load_phrases_dict({'步履蹒跚': [[''], [''], ['pán'], ['shān']]})
>>> pinyin('步履蹒跚')
[[''], [''], ['pán'], ['shān']]

详见 文档

为什么没有 y, w, yu 几个声母?

>>> from pypinyin import Style, pinyin
>>> pinyin('下雨天', style=Style.INITIALS)
[['x'], [''], ['t']]

因为根据 《汉语拼音方案》 , y,w,ü (yu) 都不是声母。

声母风格(INITIALS)下,“雨”、“我”、“圆”等汉字返回空字符串,因为根据 《汉语拼音方案》 , y,w,ü (yu) 都不是声母,在某些特定韵母无声母时,才加上 y 或 w,而 ü 也有其特定规则。 —— @hotoo

如果你觉得这个给你带来了麻烦,那么也请小心一些无声母的汉字(如“啊”、“饿”、“按”、“昂”等)。 这时候你也许需要的是首字母风格(FIRST_LETTER)。 —— @hotoo

参考: hotoo/pinyin#57, #22, #27, #44

如果觉得这个行为不是你想要的,就是想把 y 当成声母的话,可以指定 strict=False , 这个可能会符合你的预期:

>>> from pypinyin import Style, pinyin
>>> pinyin('下雨天', style=Style.INITIALS)
[['x'], [''], ['t']]
>>> pinyin('下雨天', style=Style.INITIALS, strict=False)
[['x'], ['y'], ['t']]

详见 strict 参数的影响

如何减少内存占用

如果对拼音的准确性不是特别在意的话,可以通过设置环境变量 PYPINYIN_NO_PHRASESPYPINYIN_NO_DICT_COPY 来节省内存。 详见 文档

更多 FAQ 详见文档中的 FAQ 部分。

拼音数据

Related Projects

You can’t perform that action at this time.