熠朗数据库

1、数据库系列产品

熠朗数据库是指以数据库方式为客户提供标准数据或定制数据,用户可将该数据植入自己的业务生产环境,在其网站、自有产品及应用中实现数据调用,支持公司各业务系统功能实现的数据平台。

熠朗吸收业内现有的数据库产品优势,并结合自身经验,针对不同的服务领域,推出了微观、宏观行业、文本研究和深度研究四大类数据库,具体包括经济金融研究、海关进出口、工商企业、工业企业、中企联;宏观、行业、区域经济、城市空间;高频、信用评价、长三角研究;公告信息、研究报告等数据库系列产品。

2、数据库建设背景

数据库产品相对于通用的客户端产品及移动端产品更为复杂,用户的需求和平台环境千差万别,这对数据库内容建设、传输、转换、存储及调用等提出了较高的要求。熠朗吸收业内现有的数据库产品优势,同时结合多年数据领域工作经验,自主研发一套针对多领域的高效且精准的数据库产品。

该产品可支持多种平台下的不同的数据库存储格式如SQL SERVER、ORACLE、MYSQL等,并支持多种数据格式间的转换,为用户的信息服务提供了强有力的支持。同时加强售后服务,为数据库二次应用提供全面支持。

3、数据库优势

3.1 体系结构科学

(1)专业的数据库表设计

数据库表结构设计专业化。数据库表结构是数据统计、关联应用的最为基础的因素,熠朗认真分析目前业内各信息加工商表结构设计存在的问题,通过专业化人才进行全面细致的数据库客户应用调研,坚持“最少的关联调用最多的信息”原则,目前已经获得良好客户的一致好评。并且,面向不同对象提供专业的业务内容,通过与券商、基金、保险等专业用户的战略性合作,站在用户角度推动数据进步,保障数据库内容领先业内。

(2)科学规范的编码

遵循“数据分类与编码基本原则与方法”标准,结合行业现有的数据库分类情况,以数据中心有效管理、组织数据、最终用户快捷地查找数据为目的,熠朗对海量的数据进行科学有序的组织、管理,保证高层数据分类统一,底层数据分类自行研制,充分考虑各个数据中心的分类编码。

(3)丰富的下载格式

该产品可支持多种平台下的不同的数据库存储格式如SQL SERVER、ORACLE、MYSQL等,并支持多种数据格式间的转换,为机构的信息服务提供了强有力的支持。落地文件支持EXCEL、CSV、文本文件格式。系统自动提供高频数据下载工具,可以自动将下载增量更新文件。落地文件按品种和日期分成目录,同一天的证券按证券代码保存成文件。

3.2 数据内容优质

(1)涵盖范围广泛

熠朗数据库包含微观、宏观行业、文本研究和深度研究四大类,具体包括经济金融研究、海关进出口、工商企业、工业企业、中企联;宏观、行业、区域经济、城市空间(全球);高频、信用评价、长三角研究;公告信息、研究报告等数据库系列产品。

系列产品涵盖范围广泛,通过标准接口覆盖证券、基金、银行、信托等金融行业数据;宏观、行业、区域等市场研究数据;并涉及债券、货币、衍生品等多个市场金融产品数据,服务于用户所有业务系统。

(2) 历史数据完整

熠朗数据库保留数据的完整性,数据频度齐全。金融数据全面,包含丰富的沪深上市公司、基金、股票、指数等历史数据;提供上市金融产品详细的分笔高频数据。宏观行业数据包含国内外宏观、行业层面的年度、季度、月度数据。区域数据细分到省、市、区县数据,按全国、分省、分行业进行查询。

(3) 数据及时更新

所有信息第一时间滚动更新,核心数据重点保证。业绩报告披露期间,对于夜间非正常时间披露的财务、分红、股东股本等核心数据,安排夜班采集,当日凌晨就可以向客户提供。

专线数据传输宽带保证。熠朗以专线连接,中央数据库直接写入远程产品数据库。同时在电信、网通、教育网都布有服务器,最大程度保证数据传输速度。先进的通讯工具从技术上保证数据通讯及时性,减少数据的通讯延迟,通讯时间不到1分钟。

3.3 严控数据质量

(1) 数据来源权威准确

    数据来源于国家统计局、地方政府网站等官方网站。所有数据来源合法、权威、稳定,从源头上保证数据准确性。而且,数据规范性高,衍生指标不仅丰富且计算正确,数据准确性高。

在长期的数据库规划建设过程中,熠朗已形成规范的数据库处理流程。通过科学的录入审核和程序自动校验机制、分期分批的大面积再审核制度,为熠朗数据库的准确性提供了坚实的保障。

(2)多重数据校验

熠朗利用大数据、人工智能等技术实时跟踪采集了近万个地方政府网站等官方的数据来源。采用自然语言分析、人工智能等技术进行智能解析、提取数据。并且结合国家统计局等来源进行交叉比对,校验,保证了数据的准确性又提高了数据的实时性。

    数据从采编录入到通讯客户过程中的五道校验过滤程序;入库前人工审核;采集库校验过滤;转换校验过滤;统一中心库校验过滤;双录入校验;质检部及自动之间平台全程7*24小时进行校验过滤。

(3) 分析工具先进

熠朗利用现今先进的技术爬取手段,实时采集第一手原始披露数据。利用开源的kettle工具,同时增加大量自主研发的高性能、多应用场景的数据解析组件,对原始文件数据进行多样化解析。

所有数据经过多重数据校验、过滤、结构化清洗过程,并经由SAS分析工具加工纠错,较大程度实现自动化,提升数据质量。