sys-研究领域
首页 > 研究领域 > 研究方向  
研究方向
动态流数据实时处理方向

面向高速并发的流数据,研究面向业务计算和业务分析的数据模型、计算流程,研究如何利用以虚拟化基础设施,在有效共享资源的前提下保障大规模流数据处理的高效性。在大规模流数据的表达模型和并行处理研究基础上,设计集群可扩展、计算可扩展的计算框架,研究面向大规模流数据的数据模型、在线处理技术和并行化计算系统结构。

流数据挖掘与分析方向

如何有效地挖掘和发现大规模流数据中的数据价值和知识正在成为研究界和企业关注的焦点问题。由于不同领域所关注的挖掘对象、挖掘目标差别较大,当前很多工作都是着眼于某个特定领域的研究。本研究方向以面向智慧城市的时空流数据挖掘需求为出发点,以多源流数据为挖掘对象,以高效、准确、可伸缩的挖掘算法为核心关注点,重点围绕大规模流数据的质量、流数据的优化组织、面向大规模流数据的分析以及流数据挖掘结果的可视化等开展研究。

流数据集成与服务计算方向

数据集成技术是传统实现跨组织分布、异构数据的汇聚与共享的主要技术手段,其目标是使得多源、异构、分布的数据源在逻辑上或物理上有机地集中,并为用户提供一致的数据视图。然而,传统的基于模式匹配和集成的数据集成方法已经难以应对流数据的实时性、持续性、大规模特性等新特点,亟需一种新的、能打破信息系统间的壁垒、反映数据时空特性的集成基本抽象,并支持用户按需、高效、即时的集成多源数据,并保障数据视图的新鲜性。此外,智能手机和移动网络的高速发展,也为用户提供了随时随地访问数据的有效载体。为此,本研究方向关注如何有效利用移动计算技术,无缝集成移动计算设备与云基础设施,使得用户能够随时随地、按需灵活的访问云端数据、使用云基础设施的服务。

流数据云基础设施方向

面向大规模流数据集成与分析对基础设施的动态可伸缩及可靠性保障需求,研究利用以虚拟化为代表的云计算技术来分配和共享基础设施资源,解决大规模流式感知数据的集成与实时处理问题。本研究方向以海量、持续的流式感知数据存储组织模型和并行计算模型为突破口,按照提高无共享集群节点间数据独立性、减少节点间数据传输和提高数据计算的并行化程度、充分利用多核架构来实现实时处理要求的基本思路,研究面向大规模流数据集成的新型云基础设施理论和技术。

流数据行业应用和标准化方向

以相关研究成果为基础,重点结合智慧城市建设特别是智能交通等相关应用领域,对大规模流数据信息与分析技术的相关研究成果进行应用实践与检验,研究基于相关技术的行业应用解决方案,并在智能交通等相关领域进行实验与验证,同时在实践过程中归纳不同应用领域典型的大数据集成模式,并逐步推广到智慧城市建设的多个领域应用,从而为流数据集成与分析技术落地提供支撑。以行业应用为牵引,重点建设大规模流数据仿真、系统评测及体验实训等三个公共服务平台,提供大数据集成的仿真环境、系统评测环境,以及流数据集成系统体验与培训环境。同时,在使用应用单位众多、服务对象广泛、参与建设管理多元化的复杂情况下,研究从流数据集成及分析技术到行业、领域应用到智慧城市应用等多层次的建设标准和规范,以保障大规模流数据集成与分析技术在未来智慧城市中推广应用的需求。

数据与服务科学基础理论方向

动态、高维、大规模、带有时间和空间语义、处于流动状态、无限数据序列的流数据,带来了相关数据处理和分析在时间、空间和关系维度的高度复杂性,传统的学习理论、认知理论和计算理论都不再适用,需要有新型的学习理论和认知理论、新的计算范式、计算度量和评估方法、以及研究数据计算复杂性的基本理论。本研究方向针对大规模时空流数据的集成和分析,建立形式化、结构化的数据描述和数据建模方法,以及能够有效化简复杂度的时空数据分析方法。此外,面向多模态的大数据所形成的错综复杂的关系,引入复杂网络理论来分析、认识流数据空间形成和演化的规律,并引入有效的控制和优化方法来引导其演化也是本研究方向关注的重点问题。

流数据安全和隐私

随着流数据规模的增大,流数据面临更大的风险和威胁,传统的数据安全和隐私保护理论和方法都面临新的挑战。针对流数据的内容时刻发生变化,如何在这种复杂环境下实现对连续动态变化的数据进行隐私保护是一个重要的研究内容。如何在尽可能少地损失数据信息的同时最大化地隐藏用户隐私是大规模数据分析也是一个亟待部署的研究方向。此外,如何提供有效的监测和度量手段以及自检和自治愈方法来保障大规模流数据集成系统的可靠性、如何实现大规模流数据的安全访问、可控共享和隐私保护,特别是多源关联流数据协同处理过程中细粒度的数据可控共享和隐私保护问题是本研究方向关注的关键问题。

    
大规模流数据集成与分析技术北京市重点实验室
地址:北京市石景山区晋元庄路5号(北方工业大学第五教学楼0803室) 电话:010-88803556