科研管理 ›› 2022, Vol. 43 ›› Issue (9): 32-40.
张潮1,2,3,冷伏海2
Zhang Chao1,2,3, Leng Fuhai2
摘要: 政策信息学是一门新兴学科,用数据驱动的智能化方法提高决策质量是其中的一类重要研究方向。科学研究与政府政策的制定是相互影响和协同发展的,以科技文献为基础的多学科交叉领域知识计算可为政策研究提供知识分析和知识发现,进而提供需求分析和政策场景构建。语言是人类最有代表性的智慧特征,由学者撰写的学术文献中文字的部分体现了人类的思想精华,使用可以自行学习文本上下文的自然语言处理算法,可将这一部分思想精华总结归纳,形成含有概率,以及具有丰富性和立体性的主题,从而支持询证决策。本文以交叉领域“绿色创新”为例,使用无监督的隐含狄利克雷分布主题模型分析6891篇中英文文献摘要,发现英文文献聚焦绿色创新的一般性问题,比如“企业技术成本和政府补贴”“生态环境治理”和“二氧化碳排放和可再生能源”等;而中文文献聚焦中国问题,比如“经济要素与高质量发展”和“绿色创新空间溢出与区域发展”等。中英文文献都关注的议题包括“中国经济发展和环境规制”等。使用机器学习算法分析科技文献数据,作为政策的事前分析方法,具有科学且高效、质量高、内容有效和易沟通的特点。此方法为政府基于充分信息的循证决策和智能决策提供新思路。