斯坦福NLP和社交网络应用公开课放出
2019-09-10
随着 NLP 技术的成熟(自然语言处理,Natural Language Processing,是研究人与计算机交互的语言问题的一门学科),不少人文社科领域的专家也呼吁结合相关技术进行研究和学习。近日,斯坦福大学发布了一门明年 1 月的公开课程,主要关注 AI 中的自然语言处理和社交网络的结合应用,适合文科生学习。近日,斯坦福大学的另一门 NLP 公开课程也放出了课程通知,即将于 2020 年 1 月开始授课。
这门课程最大的亮点在于:主讲 NLP 和人文社会学科的结合。课程对技术的介绍主要针对的是相关的应用,而非为了技术而讲技术。同时,课程要求也不高,很适合懂一点编程的文科学生学习。
据課程页面介绍,这门课程偏向于学科交叉。它结合了自然语言处理、信息抽取和社交网络,是一项在介绍 NLP 知识的同时融合社交网络应用的课程。
具体而言,课程会像很多 NLP 基础课程那样,介绍自然语言处理的相关知识。在算法方面包括:朴素贝叶斯、逻辑回归、词嵌入、词向量等内容。在应用方面则包括了情感分析、信息抽取、推荐系统和对话机器人,主要用于社交网络。此外,对于不了解 Python 的人来说,课程提供了一个可选的 Python 指导。
从内容来看,课程偏向入门,甚至没有看到神经网络之类的复杂模型。尽管课程要求中提到学生如果学习了斯坦福大学的 CS107、CS103 或 CS109 课程会很有帮助,但是这些也不是强制的。不过,如果学生参加过了 106B 的课程,具有一些编程经验会更好。
在教科书方面,课程使用的都是电子版的教科书,分别是以下两本:
书籍 1:Speech and Language Processing(3rd ed. draft)。这本书是电子版的,可以从网站直接打开。
书籍 2:Introduction to Information Retrieval.(信息检索概论),作者是著名的 Christopher Manning 等。
斯坦福大学有一个免费阅读和下载地址:https://nlp.stanford.edu/IR-book/pdf/irbookonline reading.pdf,课程共有十周,每周两次课,目前已经放出了完整的目录。
这门课程的主讲人是 Dan Jurafsky,是斯坦福大学的一位教授。主要研究方向是自然语言处理和社会科学的应用。
这位老师曾担任了 CS384 等课程的教师,也在 2012 年帮助过 Manning 在 MOOC 上的公开课。从专业背景来看,让这位老师教授这门课也就不足为奇了。对于人文社科和 AI 的结合,近年来已经可以看到类似的趋势,如李飞飞等利用计算机视觉统计社区车辆类型,进而预测该社区在大选中的投票趋势。斯坦福大学本次公开这样一门课程,无疑会鼓励更多非计算机领域的学生,利用 AI 技术推进工作和研究。