更新:2022-03-24|关注3964 人
·TOP30院校申请要求 |
|
||||||||||||
·TOP50院校申请要求 |
|
||||||||||||
·TOP100院校申请要求 |
|
时间 | 内容 |
2周远程辅导 | 项目背景了解,文献阅读,编程训练 |
1周实地实习:每天9:00-16:30 |
Day1:文本聚类技术 l常用文本聚类技术 lk-means算法介绍 Project 1:对文档进行向量化表示 |
Day2:主题建模技术 lPLSA算法介绍 lLDA算法介绍 Project 2:实现k-means算法 |
|
Day3:内容安全技术 l内容安全介绍 l典型应用案例介绍 l常用技术 Project 3:实现PLSA算法 |
|
Day4:文本聚类在内容安全领域的应用 l隐秘通信 l主题模型在内容安全领域的应用 Project4:利用LDA算法找到文本主题 |
|
Day5:基于文本聚类的邮件数据分析 l分析邮件数据 l展示分析结果 l项目开放问题讨论与下阶段任务布置 |
|
2周远程辅导 |
完成实验剩余部分,并完成实验报告。 1. 继续在某数据集基础上,用pagerank算法找比较重要的几个人,从主题词中分析人物特点,职务等信息 2. 利用公开的中文语料库,比如搜狗语料库,做文本分类,计算下分类精度,对比不同算法的精度,效率 |
以上是美世教育整理的美世留学教育全部内容。