-
杭州电子科技大学特聘教授
岗位申请表
设岗学科:
计算机科学与技术
设岗部门:
计算机学院
申请岗位:□特聘教授
p>
/
?
特聘副教授
申请人姓名:
叶晨
申请人国籍:
中国
现工作单位:
哈尔滨工业大学
联系电话:
填表日期:
2019
年
10
月
25
日
杭州电子科技大学
- 1 -
编号:
填表说明
一、填写内容必须实事求是,一式三份。
< /p>
二、表
1
至表
5
由申请人本 人填写。表
2
、表
4
为活页,可
< br>另附页,表
3
按要求限填。
1-5
项内容及 其所提供佐证材料由所
在学院负责审核。
三、
表
5
为活页,
由申请人提供
3 p>
名以上国内外学术造诣高
深的著名同行专家填写,
每位专家填 写一份。
如推荐意见为外文,
需依照格式将其翻译为汉语,并将原件附后
。
四、
表
8
由所在学院 学术委员会
/
评议组填写,表
7
、
9
由设
岗部门填写。
五、
p>
提供所填内容附件材料一份
(
装订成一册
)
< p>。附件材料一
般应包括:
(
1
)
学历学位证书复印件;
(
2
)
身份证或护照复印件;
(
3
)在海外学习或工作的 证明材料;
(
4
)主要成果(代表性论
著
、
专利证书、
产品证书)
复印件或证明材料;
(< /p>
5
)
领导
(参与)
过的主要
项目证明材料;
(
6
)奖励证书复印件;
(
7
)其他需要提
交的材料。
- 2 -
1.
申请人简况
姓名
叶晨
性别
女
国
籍
中国
出生年月
籍贯
19920228
浙江
现任专业
任现职
无
无
技术职务
时间
现工作单
从事专业及
哈尔滨工业大学
(在读博 士)
位
研究方向
< /p>
最后学历
/
学位
计算机科学与技术
博士
及所学专业
国内外主
要学术及
无
海外经历
社会兼职
学习简历(从本科起)
计算机软件与理论
多源数据真值发现
取得时间
2020.04
美国纽约州立大学布法罗
分校联合培养博士
< /p>
2009.09-2013.07
,申请人在哈尔滨工业大学计算机科学与 技术学院攻读
本科学位,研究课题为《基于众包的缺失填充研究》
,导师 为王宏志教
授。
2013.09-2015.
07
,申请人在哈尔滨工业大学计算机科学与技术学院攻读
硕士学位,研
究课题为《基于众包的数据清洗关键技术的研究》
,导师
为王宏志教授。
2015.09
至今,申请人在哈尔滨工业大学计算机 科学与技术学院攻读博
士学位,研究课题为《多源数据真值发现算法研究》
,导师为王宏志教
授。
教学、科研经历
2016.09.12-2017.09.30
,申请人在美国纽约州立 大学布法罗分校
(State
University of New
York, University at Buffalo)
留学,
作为联合培 养博士从
事多源数据真值发现课题的相关研究,导师为数据挖掘知名青年专家
Jing Gao
老师。
- 3 -
2.
申请人主要学术成就综述
近五年所取得的主要教学科研成绩(包括教书育人、科学研究、成果论著、荣誉获奖
等)
(可另附页)
一.科学研究
申请人的研究工作主要集中在两个方面,一方面是多
源数据真值发
现,另一方面是基于众包的数据清洗,近五年以第一作者发表论文
9
篇,
参与科研项目
4
项。
申请人于
2016
年开始对多源数据真值发现 技术进行研究,
于
2016
年开
始参与国
家自然科学基金青年科学基金项目
“
大数据一致性错误管理理论
< br>与关键技术
”
的研究工作,与
2018
年开 始参与国家自然科学基金面上项目
“
基于互联网金融的投资者风险感知、 信息不对称与尾部市场效率研究
”
,
发表了
3
篇相关文章。
1)
论文《
AutoRepair: an automatic repairing approach over multi-source
data
》发表在
KIS(2019)
上, p>
[
SCI
源,中
科
院
三
区]
。文 章首次将真值
发现与数据修复思想相结合,
同时解决了数据中存在的实体 之间的信息不
一致和数据源之间的信息冲突。
2)
论文《
PatternFinder:
Pattern
discovery
for
truth
discovery
》发表在
KBS(2019)
上,
[
SCI
源,中科院 二区]
。文章首次研究了如何在多源异构
数据上直接挖掘实体真值问题,
创新性的通过挖掘数据中潜在的模式来发
现相关真值。
3)
论文《
Multi-source data repairing powered by integrity constraints and
source reliability
》
发表在
INS(2020)
上,
[
SCI
源,
中科院一区
,
TOP
期刊]
。
文章首次提出了一种由否定约束定义实体关系,
求解同 时满足条件约束和
可靠数据源支持的真值发现技术。
申请人于
2014
年开始对基于众包的数据清洗技术进行研究,
于
2015
年开始参与国家自然科学基金项目
“
大数据错误 检测与修复关键技术的研
究
”
和国家科技支撑计划
“
基于大数据的综合健康服务关键技术研发与应
用
”
的研究工作,发表了
6
篇相关文章。
1)
论文《
Effective
Bayesian-network-based
missing
value
imputation
enhanced
by
crowdsourcing
》被
KBS
[
SCI
源,中科院二区]
已刊出待发
- 4 -
表。
文章采用了一种贝叶斯网络与 众包平台相结合的新方法进行劣质数据
的缺失填充,
并全面测试了算法在 真实的众包平台和模拟的众包反馈上的
性能。
2)
论文
《支持基于众包的数据清洗的主动学习技术》
被
《软件学报》
[
国
内
期刊,一级学报,
EI
源]
录用待发 表。文章研究了如何将机器学
习算法与众包有效且低成本的结合在一起改善数据质量,<
/p>
提出了两种支持
基于众包的数据清洗的主动学习模型,可解决多种数据清洗
问题。
3)
论文《
Crowdsourcing- enhanced
Missing
Values
Imputation
based
on
Bayesian
Network
》发表在
< p>DASFAA(2016)(录取率
10%-25%)
上,是
CCF
推荐
B
类国际会议论文,被
EI
索引。文章提出了人机交互思想,使用贝
叶斯网络作为概率
推理模型,
同时利用众包平台来获得概率推理需要的额
外信息提高准确度
。
4)
论文《
Capture
Missing
Values
Based
on
Crowdsourcing
》发表在
W
ASA(2014)
上,为
CCF
推荐 p>
C
类国际会议论文,被
EI
索引。该文章研
< p>究了不同类型的缺失数据,首次提出基于众包做缺失填充的思想。
5)
论
文
《
Truth
Discovery
Based
on
Cro wdsourcing
》
发
表
在
< br>W
AIM(2014)(
录取率
18%- 25%)
上,是
CCF
推荐
C
类国 际会议论文,被
EI
索引。文章首次将大众反馈的知识结合主动学习框架 运用到真值发现
中,从多数据源提供的大量信息中筛选出正确信息。
< /p>
6)
论
文
《
CrowdCl eaner:
A
Data
Cleaning
System
Based
on
Cr
owdsourcing
》发表在
ApWeb(2014)(
录取 率
18%-25%)
上,是
CCF
推荐
< p>C
类国际会议论文,被
EI
索引。该系统是一个人机 交互的众包系统,立
足于解决多个类型的劣质数据,具有高精确度低成本、简洁易懂易操
作、
用户界面友好等特点。
二.荣誉获奖
2014
年获得硕士国家奖学金
2015
年获得哈尔滨工业大学优秀硕士毕业生称号
< /p>
2016
年获得国家留学基金赴美国纽约州立大学布法罗分校访学一年 p>
2019
年获得深交所企业奖学金,哈尔滨工业大学优秀学 生称号
- 5
-
3.
代表性课题、奖励、论文论著简况表
3.1
省部级及以上研究项目一览表(限填5项)
序
号
课题名称
课题来源
课题
经费
立项时间
2015.01-2018.1
2
2015.04-2017.1
2
2016.01-2018.1
2
2018.01-2021.1
2
是否
结题
已结
题
已结
题
已结
题
未结
题
4
4
13
候选
人
排名
8
1
大数据错误检测与修复关
国家自然科 学
82
键技术的研究
基金面上项目
万
2
基于大数据的综合健康服
国家科技支 撑
167
务关键技术研发与应用
计划
万
3
大数据一致性错误管理理
国家自然科 学
20
论与关键技术
基金青年项目
万
4
基于互联网金融的投资者
国家自然科 学
50
风险感知、
信息不对称与尾
基金面上项目
万
部市场效率研究
5
3.2
省部级及以上科技奖励一览表(限填5项)
序
号
1
2
3
4
5
- 6
-
成果名称
颁奖单位
获奖
等级
获奖
时间
候选
人
排名
3.3
代表性论文、著作一览表(限填
10
篇、部)
序
号
论文和著作名称
出版刊物名称、
发表时
间
Knowledge-Based
Systems
(KBS) (2020)
DOI:10.1016/
.2019.105199
软件学报
(2020)
DOI:
10.13328/
.005801
Information Sciences
507:
386-403
(2020)
候选
人
排名
1
级别
影响
因子
1
Effective
Bayesian-network-based
missing value imputation
enhanced by crowdsourcing
2
支持基于众包的数据清洗
的主动学习技术
中科院
2
区
5.501
SCI
源
国内
TOP
期
1.829
刊
一级学报
EI
源
中科院
1
区
5.524
TOP
期刊
SCI
源
中科院
2
区
5.501
SCI
源
中科院
3
区
2.397
SCI
源
CCF B
EI
源
无
1
3
Multi-source data
repairing
powered by integrity
constraints and source
reliability
4
PatternFinder: Pattern
discovery for truth
discovery
5
AutoRepair: an automatic
repairing approach over
multi-source data
6
Crowdsourcing-enhanced
missing values imputation
based on Bayesian network
7
CrowdCleaner: A
Data
Cleaning System Based on
Crowdsourcing
8
Truth Discovery Based on
Crowdsourcing
9
Capture Missing Values
Based
on Crowdsourcing.
1
10
基于众包的电子商务数据
实体分类系统
Knowledge-Based
Systems
176:97-109
(2019)
Knowledge and
Information
Systems
61(1): 227-257 (2019)
Database Systems for
Advanced Applications
DASFAA
(1) 2016:
67-81
Web
Technologies and
Applications
2014:
657-661
Web-Age Information
Management
2014:
453-458
Wireless
Algorithms,
Systems and
Applications
2014:
783-792
计算机研究与发展
2013, 50(z1)
1
1
1
1
CCF C
EI
源
CCF C
EI
源
CCF C
EI
源
无
1
无
1
无
1
一级学报
无
注:级别一般填写
top
期刊,
SCI< /p>
(
1
区、
2
区等)
、 一级、核心期刊等。
- 7 -
4.
工作思路及预期目标
申请
人对履行特聘教授
/
副教授岗位职责的工作思路及聘期目标等
(< /p>
可另附页
)
在科学研究方面,面对数据的
多源性、嘈杂性、结构多样性,申请人
计划以数据关键信息提取的
“多源 数据真值发现”
、
“劣质数据清洗”
、
“异
构数据信息提取”
三个科学问题为核心,
研究数据关键信息提取 的基础理
论和关键技术,
提出完整的数据关键信息提取的理论体系、 p>
方法学和关键
技术,
包括从物理信息系统等多数据源有效地获 取高质量多模态数据的理
论和技术、
信息错误的自动检测与修复的理论和 技术、
异构信息上的知识
发现和深度演化的理论和技术、
研制数据关键信息提取原型系统,
聘期目
标申请成功国家自然科学基金青
年项目或者省部级项目
1
项,
在国际顶级
与重要学术会议和期刊发表
8
篇以上高质量论文,
争取在
2
个聘期内申请
成功国家优秀青年科学基金项目
1
项。
在教学方面,
申请人有多年的数据 库、
数据质量相关研究经验,
对数
据库、数据结构、算法
设计与分析、大数据算法等课程担任过助教工作,
教学理解颇深,
有着一 整套完整教学方案,
讲解与动手相结合,
实际教学
经验丰
富且反馈都很好,相信可以很好的分担贵院在数据库、数据结构、
算法设计与分析、
p>
大数据算法等课程的教学工作。
聘期目标承担
1
门以上
课程的课堂讲授任务,
拟定所承担课程的教学大纲及教学实施计划, p>
认真
备课,研究本课程、本学科的发展方向,不断更新和充实教学内容,总结
教学经验,不断改进教学方法和手段,提高教学质量。
在培养学生方面,
申请人计划从学习理论知识和动手实践两方面指导
学生,
计算机科学本身就是一门理论与实践结合的非常紧密的学科,
除了 p>
培养学生的全面性外,
应根据不同学生的特点,
使其掌握并擅 长一到两门
技术,比如说,计算机编程语言分很多种,但一定要精通一门,并且语言
p>
只是工具,
要对其数据结构和算法设计的能力进行提升,
而这 正是申请人
所擅长的部分。
对于不同层级的学生,
培养的 方式也不同。
对于本科生而
言,主要以夯实基础、拓展视野为主,使其具
备编能力、基础理论知识和
能够向某个具体领域拓展的能力。
对于硕士生 培养,
主要以实践为主,
理
论辅之,多实践,在实践中总
结知识经验,并具备英文论文的阅读能力,
能够通过搜索重要会议和期刊的文献解决实际
问题。
对于博士生而言,
则
主要以理论为主,
建模问题和解决问题的能力,
能够洞悉
国际前沿方向和未来数年的发展趋势,
能够发表数篇高质量论文,
向国外
名校看齐。聘期目标协助培养出具有国际一流学术水平的博士和硕士
5
名以上。
- 8
-