用活“大数据”、建好“大平台”,整合利用行业各方资源加快建设覆盖全产业链的一体化平台,是激发企业创新活力、推动行业高质量发展的重要举措。
为落实国家大数据战略、提高烟草行业科学数据利用水平、提升行业科技创新整体效能,促进科研活动的数字化转型,2018年以来,在国家烟草专卖局科技司的指导下,郑州烟草研究院牵头组织实施烟草科研大数据重大专项,坚定不移推动大数据在烟草科研领域的探索应用,全面整合烟草科研数据资源,全力打造烟草科研大数据服务平台,奋力开创大数据驱动高质量发展的新局面。
向数据密集型科研范式的转变
随着信息技术的迅猛发展,数据的爆炸性增长,计算机在科学研究中的作用不再局限于做模拟仿真,科学研究的范式正在发生深刻变化,利用数据科学进行科研探索,在主流科技界已蔚然成风。
“我们要瞄准烟草科学数据中心的发展目标,扩容数据、完善算法、增加功能,进一步挖掘蕴含在烟草科学数据中的巨大价值,为行业的科技创新和高质量发展提供强有力的科技基础支撑,推动烟草科研范式向数据密集型和数据驱动型转变。”中国烟草科技信息中心主任郑新章对于数据驱动创新的研究模式充满信心。
烟草科研大数据重大专项是由国家局科技司牵头,郑州院总负责,中国科学院计算机网络信息中心为技术依托单位,与中国烟草科技信息中心、行业各工商企业、上海新型烟草制品研究院、中国农业科学院烟草研究所及相关科研院所密切协作共同推进实施。
重大专项以构建科研大数据资源平台、综合系统平台和应用服务平台3大平台为主体,旨在建成适应需求、技术先进、内容关联、运行高效、安全可控、持续迭代的烟草科研大数据中心,实现数据资源服务、数据分析挖掘服务、知识情报服务、协同创新服务、科研管理服务、科技决策支持服务和基础设施云服务等大服务功能,探索烟草科研大数据中心可持续发展模式,为烟草行业科研大数据工程研究中心和国家级大数据工程实验室分中心建设奠定基础,着力推动烟草科研活动的数字化转型,加速烟草科研范式向数据密集型转变。
打造“一站式”烟草科研实践应用平台
“打开烟草科技知识图谱平台,论文检索只是基本功能之一。”中国烟草科技信息中心高级工程师冯伟华在浏览器里输入地址,一个深蓝背景的页面呈现出来,页面右侧浮动着一个个小小的“蒲公英”。
“一个蒲公英代表一个科研团队,放大了看,就能看到团队的核心人物是谁、参与人是谁。很多蒲公英聚在一起,就是一个科研社区了。而这种形象化的展示,背后需要科研大数据的支撑。”冯伟华介绍说,烟草科技知识图谱平台是重大专项重点研发的6个大数据应用平台之一。
郑州院依据农业方向、工业方向和科研方向的数据应用布局,围绕烟草科技创新的重点领域和烟草生产、卷烟制造的核心环节,利用关键技术研究提供的相关组件和模型,在烟草科技知识图谱、烟草育种、烟叶质量、卷烟产品设计与维护和真假烟鉴别等重点领域开展了6个大数据应用平台的研究开发,初步构建了应用价值大、推广价值高的烟草科研数据应用服务平台,积累了大量烟草科研数据,基本形成了串联卷烟产品生产流程的大数据链条,初步实现了烟草科学数据的行业共享与服务。
其中,烟草文献知识服务与知识图谱服务平台采用大数据分析、自然语言处理和知识图谱等技术,提供覆盖烟草领域“科研机构、科技人员、科技文献、科技成果”等核心实体的烟草文献数据知识检索服务和烟草科技知识图谱分析服务。烟草育种大数据平台收集了国内外烟草种质资源信息、烟草种质资源表型数据、烟草审定品种数据、烟草品种重测序数据、烟草品种转录组测序数据,构建了烟草育种主题数据库,实现了对育种数据的检索、分析和智能推送等服务功能。烟叶质量大数据分析服务平台实现了行业烟叶质量数据的有效汇聚,建立了烟叶质量预测、烟叶质量相似性分析等应用模型,具有“质量总览”“质量趋势”“质量查询”“监测点”等功能模块。卷烟产品数字化设计平台集合卷烟叶组设计、料液设计、三丝设计、表香设计、辅材设计等5大产品设计关键核心要素,研究构建了中式卷烟“风格-质量”表征算法,建立了卷烟辅助设计数据库、卷烟产品设计指标体系和多要素交互的辅助设计算法,研发了卷烟产品设计、产品维护数字化的核心模块,实现了卷烟产品设计与维护的全生命周期数字化管理。烟草近红外大数据平台采用近红外分析技术体系,分别建立了涵盖70余项化学成分指标的预测模型,完成了近红外光谱数据远程直采、传输、存储、结果预测和反馈,达到了数据有效融合与分析应用的目标,提升了近红外数据在行业内的整体价值。卷烟产品鉴别信息大数据平台构建了卷烟产品鉴别信息资源主题数据库,研究开发了卷烟产品鉴别信息采集系统,实现了约20个省级质检站真伪鉴别数据的自动采集,开发了具有卷烟鉴别信息资源共享、假烟市场分布分析、鉴别量分析、涉案卷烟品牌分析、鉴别检验卷烟样品数量变化趋势分析等功能模块的卷烟产品鉴别信息大数据平台,为行业一线打假人员识假打假提供数据支撑和技术手段。
为烟草科技创新提供强大的数据支撑
烟草科研大数据重大专项启动实施3年来,在国家局的领导下开展了3批12个方向共13个科技项目的研究。研究团队围绕重大专项的总体目标,积极开展顶层设计和项目布局,在数据资源、综合系统和应用服务平台研究上取得了较快进展。
截至目前,2018年启动的三个先导性科技项目已顺利结项,2019年启动的2个关键技术类科技项目以及6个应用系统平台类科技项目也都基本通过验收。2021年将在“卷烟产品设计与维护大数据”“烟草科学研究高质量数据集”“烟草加工工艺大数据”3个方向启动实施一批科技项目。
项目组结合烟草科学研究的特点,积极开展烟草科研大数据的顶层设计和基础架构研究,首次研究建立了烟草科研大数据资源体系和标准体系,研究制定烟草科研重点领域数据标准46项、大数据通用标准和技术标准十余项,实现了烟草科研数据资源和数据标准的顶层设计,为重大专项的顺利实施和烟草科学数据中心建设等奠定了坚实的技术基础。完成了烟草科研大数据体系架构、基础设施架构、数据架构、技术架构、安全架构和运维管理体系架构的总体设计,构建了烟草科研大数据云平台,为烟草科研大数据上层数据和业务应用的研发提供了保障。
同时,项目组围绕综合系统平台建设,开展了4个关键技术项目的布局与实施,解决烟草科研大数据在大数据引擎、模型、可视化、安全和应用集成等方面的共性和关键技术问题,为各个数据平台和应用平台的相关技术研究与系统开发提供了全方位的支撑和支持。其中,“烟草科研数据融合与关联挖掘关键技术研究”的成果有效支撑了烟草科研数据的存储、检索、汇交、治理和发布;“烟草科研大数据分析模型构建与可视化集成应用关键技术研究”项目为烟草科研大数据各业务应用提供了公共的模型、算法和可视化组件;“烟草科研大数据安全态势预警关键技术研究与应用”项目构建了威胁分析、网站安全、主机安全三大核心模块,形成了感知、分析、预警一体化安全保障能力;“烟草科研数据集成服务关键技术研究与应用”项目构建了统一的烟草科研大数据服务门户,实现了烟草科研大数据资源、服务和应用的有效整合。
烟草科研大数据已逐渐成为支撑全行业开展创新活动的重要载体和核心力量,可有力提高烟草科技创新的质与量,促进科技成果的转化和产业化,促成烟草科技创新资源信息的有效循环。因此,加强各大数据平台的推广与应用是实现数据驱动创新的关键一步。
当前,郑州院正积极通过组织线上线下培训班、走访宣讲、平台引流等多种方式不断推进6个大数据平台在行业内的推广试用,已累计向行业近70家工商企业、科研院所等提供科学数据服务,访问量十余万次,为行业科研人员在项目立项、研究、验收鉴定等环节提供基于文献、成果、知识产权、烟草种质资源、审定品种、烟叶质量、气象土壤、近红外光谱、卷烟产品信息、真假烟图像等内容的数据获取、分析挖掘和创新评价服务,有效推动了烟草科研的数字化转型,促进行业科研能力和效率的提升。
廉心清风 筑未来沐黔烟 贵州烟草商业廉洁文化建设专题