班级规模及环境--热线:4008699035 手机:15921673576( 微信同号) |
坚持小班授课,为保证培训效果,增加互动环节,每期人数限3到5人。 |
上课时间和地点 |
开课地址:【上海】同济大学(沪西)/新城金郡商务楼(11号线白银路站)【深圳分部】:电影大厦(地铁一号线大剧院站) 【武汉分部】:佳源大厦【成都分部】:领馆区1号【沈阳分部】:沈阳理工大学【郑州分部】:锦华大厦【石家庄分部】:瑞景大厦【北京分部】:北京中山学院 【南京分部】:金港大厦
最新开班 (连续班 、周末班、晚班):2024年11月18日 |
实验设备 |
☆资深工程师授课
☆注重质量
☆边讲边练
☆合格学员免费推荐工作
★实验设备请点击这儿查看★ |
质量保障 |
1、培训过程中,如有部分内容理解不透或消化不好,可免费在以后培训班中重听;
2、课程完成后,授课老师留给学员手机和Email,保障培训效果,免费提供半年的技术支持。
3、培训合格学员可享受免费推荐就业机会。 |
课程大纲 |
|
1什么是文本挖掘
2文本挖掘的基本流程和任务
3文本挖掘的基本思路
4语料数据化时需要考虑的工作
5Python常用IDE简介
6Anaconda的安装与配置
7Jupyter Notebook的基本操作
8NLTK的安装与配置
9什么是语料库
10准备《射雕》语料库
11分词原理简介
12结巴分词的基本用法
13使用自定义词典和搜狗细胞词库
14去除停用词
15词性标注及其他
16词频统计
17词云概述
18wordcloud包的安装
19绘制词云
20设置词云背景模板
21修改词云颜色
22词袋模型
23词袋模型的gensim实现
24用Pandas生成文档词条矩阵
25用sklearns生成文档-词条矩阵
26从词袋模型到N-gram模型
27文本信息的分布式表示
28共现矩阵
29NNLM模型的突破
30word2vec一出,满座皆惊
31关键词提取的基本思路
32TF-IDF 算法
33TF-IDF算法的jieba实现
34TF-IDF算法的sklearn实现
35TF-IDF算法的gensim实现
36TextRank算法
37主题模型概述
38主题模型的sklearn实现
39主题模型的gensim实现
40基本概念
41词条相似度:word2vec训练
42词条相似度:word2vec应用
43文档相似度的词袋模型实现
44doc2vec
45文档聚类
46文本分类概述
47朴素贝叶斯算法
48算法的sklearn实现
49算法的NLTK实现
50情感分析概述
51情感分析的词袋模型实现
52情感分析的分布式表达实现
53自动摘要的基本原理
54自动摘要的效果评价
55自动摘要的python实现
56RNN的基本原理
57LSTM的基本原理
58Keras+TensorFlow组合的优势
59Keras+TensorFlow组合的安装
60案例1:数据准备
61案例1:模型拟合
62案例2:数据准备
63案例2:模型拟合
|