Skip to content
master
Go to file
Code

Latest commit

 

Git stats

Files

Permalink
Failed to load latest commit information.
Type
Name
Latest commit message
Commit time
Dec 18, 2019

README.md

使用Python进行自然语言处理实践

代码环境: python --version 3.5.2
tensorflow
keras

本项目旨在归纳总结自然语言处理工程师常见实践内容,每个模块尽量包含理论(经典算法和最新paper)和实践部分。

一、常见自然语言处理任务

1、文本向量化:

1.1 tfidf

1.2 word2vec
(文件夹)word2vec:word2vec使用(done)

1.3 glove
1.4 elmo
1.5 bert
1.6 xlnet

2、文本分类问题

2.1(文件夹)sentiment:情感分析实践-目前使用word2vec和svm实现(done)
2.2 BiLSTM
2.3 HAN

3、自然语言推理问题
相似文本匹配、问答匹配)

4、语言生成问题

闲聊、摘要

5、任务型对话 对话状态跟踪、对话策略生成、用户模拟器

6、知识图谱 基于neo4j构建问答系统 transe

7、信息抽取 命名实体识别

8、自然语言基础功能: 8.1 分词

8.2 词性标注 (文件夹)HMMPostag:hmm词性标注(done)

8.3 句法分析

8.4 新词发现 (文件夹)NewWordFinder:新词发现功能(done)

8.5 指代消解

9、文本聚类

(文件夹)LDATopicModel:lda主题模型(done)

备注: (文件夹)resource:部分项目公共资源目录

About

使用Python进行自然语言处理相关实践,如新词发现,主题模型,隐马尔模型词性标注,Word2Vec,情感分析

Topics

Resources

Releases

No releases published

Packages

No packages published

Languages

You can’t perform that action at this time.