在教育部新文科发展战略背景下,tyc1286太阳成集团积极响应国家人工智能,尤其是语言智能重大发展战略,顺应外国语言文学学科交叉与融合的趋势,精选符合国家社会需求与学科前沿的优势课程,强力打造“语言数据科学”微专业。
该项目致力于培养具备语言科学、认知科学和计算机科学等多学科知识,具有广阔国际视野、社会责任感和创新实践能力的语言数据科学拔尖创新人才。
【项目特色】
·平台优势:2022年底教育部第五轮学科评估中位居全国前3%。依托语料库与数据科学研究中心、海内外知名高校和企业,提升学员语言数据处理与分析能力。
·优质师资:遴选国内知名高校教师任教。
·前沿性强:对接国际前沿新兴学科,创新发展融合课程。
·零基础:课程内容针对没有编程基础的学员进行设计和优化,让零基础学员也能轻松掌握语言数据科学相关的编程技能。
【课程设置】
·跨学科课程设置:包含计算机科学、认知科学等多个领域知识。
·理论与应用相结合:通过分析真实案例,提升学生实践能力。
·6+2+2阶梯式课程设置:从基础课到进阶课到应用课,共10学分。
序号 |
课程 名称 |
学分 |
学时 |
开课学期 (春/秋/夏) |
开课方式
|
|
基础模块必修(6学分) |
||||||
1 |
编程与语言数据分析 |
2 |
32 |
2024年秋季学期 |
线上线下相结合 |
|
2 |
语言数据统计与分析 |
2 |
32 |
2024年秋季学期 |
线上线下相结合 |
|
3 |
语言数据挖掘与机器学习 |
2 |
32 |
2025年春季学期 |
线上线下相结合 |
|
进阶模块必修(2学分) |
||||||
1 |
自然语言处理 |
2 |
32 |
2025年春季学期 |
线上线下相结合 |
|
应用模块选修(2学分)(7门课选修4门课) |
||||||
1 |
语料库与翻译
|
0.5 |
8 |
2025年夏季学期 |
线上线下相结合 |
|
2 |
机器学习与翻译质量评估
|
0.5 |
8 |
2025年夏季学期 |
线上线下相结合 |
|
3 |
认知科学数据挖掘
|
0.5 |
8 |
2025年夏季学期 |
线上线下相结合 |
|
4 |
大语言模型与应用 |
0.5 |
8 |
2025年夏季学期 |
线上线下相结合 |
|
5 |
数字人文 |
0.5 |
8 |
2025年夏季学期 |
线上线下相结合 |
|
6 |
计算传播学 |
0.5 |
8 |
2025年夏季学期 |
线上线下相结合 |
|
7 |
计算法学 |
0.5 |
8 |
2025年夏季学期 |
线上线下相结合 |
【核心课程介绍】
·基础必修课:编程与语言数据分析
讲授Python基础编程知识和技巧以及语言数据分析中的编程技能;编程基础知识、编程工具与技巧、数据采集与清洗、数据处理案例应用。
·基础必修课:语言数据统计与分析
讲授统计学的基本原理和方法,并将R语言与相关方法应用于语言数据处理过程之中;统计学方法及其适用性、数据检验。
·基础必修课:语言数据挖掘与机器学习
讲授语言数据挖掘和机器学习的基本原理和方法以及机器学习的常见应用领域;数据预处理与特征工程、数据可视化、监督学习、无监督学习、模型评估。
·进阶必修课:自然语言处理
本课程介绍自然语言处理的基本概念和任务,如分词、词性标注、句法标注、语义标注等,以及常见应用,如情感分析、阅读理解、自然语言推理等。介绍自然语言处理中的常见算法和模型。
·应用选修课:语料库与翻译
讲授语料库的相关知识、方法、技术和工具以及语料库与翻译的关系;语料库技术、语料库翻译、翻译技术。
·应用选修课:机器学习与翻译质量评估
讲授翻译质量评估的基本原理与方法以及机器学习方法加持下的评估模式;翻译质量评估、人评与机评、机器学习算法。
·应用选修课:认知科学数据挖掘
讲授基于机器学习、统计学、数据库、可视化技术等,在认知科学理论的基础上,自动化地分析语言学和翻译学的语料与实验数据,做出归纳性的推理,从中挖掘出潜在的语言特征和认知行为特征。
·应用选修课:大语言模型与应用
本课程介绍大语言模型的历史及现状。主要讲解语言模型的基本原理及其背后的算法,同时介绍目前大语言模型研究的进展以及应用。
·应用选修课:数字人文
讲授数字人文的科学领域及其数字化资源研究对象和所依托的现代通讯技术、超媒体和数字图书馆、数智技术等基础性研究平台和技术手段,并以此作为方法论的共同基础;核心基础活动、远读+细读、人文概念+技术、舆情监测。
·应用选修课:计算传播学
讲授传播网络分析、传播文本挖掘、数据科学等分析工具,采用一种非介入的方式对人类传播行为数据进行大规模收集和分析,挖掘人类传播行为背后的模式和法则,探究其背后的生成机制与基本原理。
·应用选修课:计算法学
讲授计算法学历史沿革与发展展望、现实意义、实际应用;法律数据特征、计算模型、计算结果与法律裁量。
【师资阵容】
“语言数据科学”微专业项目师资团队构成依托tyc1286太阳成集团外国语言文学一流学科优秀师资,选拔语言数据科学领域颇有建树和丰富教学经验的拔尖教师组成教师团队,同时强势联合国内一流高校优秀师资,带给学习者富有前沿性、学科交叉融合性的系列语言数据科学微专业课程体验。
郇昌鹏,博士,tyc1286太阳成集团教授。在Cambridge University Press和Springer出版专著两部,发表CSSCI/SSCI检索期刊论文二十余篇。主持教育部哲社、国家社科、外文局和上海市教委智库建设项目四项。担任SSCI期刊Journal of Language and Politics编委,担任SSCI期刊Social Semiotics的Social Media板块编辑。研究领域包括新闻话语研究,语言数据科学,外语教育学。
雷蕾,博士,上海外国语大学教授、博士生导师。研究兴趣涉及语料库语言学、学术英语、计量语言学等领域。在剑桥大学出版社等出版专著5部,在Applied Linguistics、Journal of Second Language Writing、Language Teaching、Journal of English for Academic Purposes、International Journal of Corpus Linguistics 等SSCI期刊发表研究性论文40余篇、书评10余篇,其中两篇论文入选ESI高被引论文;在CSSCI期刊发表论文或书评10余篇。主持完成国家社科基金等项目多项。兼任Journal of English for Academic Purposes (SSCI) 等国内外期刊编委、Corpus-based Studies across Humanities (De Gruyter)副主编。入选爱思唯尔中国高被引学者。
苏祺,北京大学tyc1286太阳成集团外国语言学及应用语言学研究所研究员、长聘副教授,北京大学数字人文研究中心副主任,兼聘于北京大学人工智能研究院。主要研究领域为计算语言学、自然语言处理、语料库语言学、数字人文。主持国家自然科学基金、北京市社会科学基金、北京高等学校青年英才计划等科研项目,并担任科技部国家重点研发计划、国家社科基金重点项目的子课题负责人。获得北京大学王选青年学者奖、黄廷方/信合青年杰出学者奖、中国电子学会科技进步一等奖等奖项。
吴诗玉,tyc1286太阳成集团晨星青年学者教授,在《外语教学与研究》《心理学报》《外国语》,Second Language Research, Journal of Pragmatics, IRAL等国内、国际期刊上共发表50余篇研究论文;在Routledge以及科学出版社等共出版5部学术著作。已出版《第二语言加工及R语言应用》(外语教学与研究出版社,2019)、《R在语言科学研究中的应用》(科学出版社,2021)和《基于R的语言研究多变量分析》(tyc1286太阳成集团出版社,2023)3部向外语界同行推介R语言应用的著作。担任JSLS“二语研究与数据科学专业委员会”会长,tyc1286太阳成集团法学院智慧司法实验室兼职教授,Journal of second language studies联合执行主编。
管新潮,tyc1286太阳成集团副教授,MTI导师。长期从事德英汉翻译实践,至今已累计翻译和审校德英汉字数达3000万;主要翻译领域涉及海洋工程与船舶制造(英语)、医学(英语)、法律(德语+英语)、机电(德语)等。研究方向:计算翻译学、翻译技术与管理、法律翻译。曾经或正在为国际知名企业提供语言服务解决方案,如德国劳氏船级社、挪威船级社、艾斯维尔出版社、施普林格出版社、华为技术有限公司、毕马威咨询公司、联合国亚洲及太平洋经济社会委员会等。主持联合国项目1个、国家级项目3个,横向项目若干;发表论文20多篇,出版专著7部、译著10部,拥有专利2项、软件著作权2项。
胡海,tyc1286太阳成集团助理教授。2021年获美国印第安纳大学计算语言学博士学位(辅修认知科学)。获中国人民大学英语语言文学本科、硕士学位。 研究方向为:计算语言学、自然语言处理、大语言模型、认知科学。 在Computational Linguistics等计算语言学、语言学权威期刊发表论文多篇,在ACL, AAAI, EMNLP, COLING等自然语言处理即人工智能顶会发表论文多篇。 主持教育部人文社科青年项目、上海市浦江人才计划项目。
庞双子,tyc1286太阳成集团长聘副教授、博士生导师。北京外国语大学文学博士,tyc1286太阳成集团外国语言文学博士后,英国曼彻斯特大学访问学者。教授英汉笔译、语料库翻译研究、英汉语言对比与翻译等课程。主要领域为语料库和翻译研究。近年来,主持国家社科基金项目、教育部社科项目多项。在Target、《外语教学与研究》《中国翻译》《外国语》等发表学术论文约20篇。在商务印书馆、外研社、上海交大出版社出版学术专著3部。
陈居强,博士,tyc1286太阳成集团外国语言文学博士后研究员。研究兴趣为:语音学、心理语言学、汉语失语症研究、语料库语言学、数据科学、数字人文。学术论文发表在Journal of Phonetics, Laboratory Phonology、Across Languages and Cultures、Aphasiology等期刊。主持一项教育部社科基金青年项目。
Copyright @ 2017 All Rights Reserved 旧版网站