数据在经融证券中的地位和作用论文

时间:2022-06-22 22:09:42 证券 我要投稿
  • 相关推荐

数据在经融证券中的地位和作用论文

  1我国企业信息系统建设的数据基础薄弱

数据在经融证券中的地位和作用论文

  1.1我国企业的信息系统建设处在初级阶段

  XX新闻社网站20XX年6月1日报道,信息产业部电子信息中心和蓝田市场研究公司双方合作进行了首次全国范围的信息产业大型调查活动,获得了全面的基础数据报告(简称ITD20XX)。调查结果显示,我国80%以上国家重点企业已建立办公自动化系统和管理信息系统,70%以上接入互联网,50%以上建立了内部局域网。企业已不同程度地在日常管理和决策环节上应用了信息技术。部分企业已经开始借助互联网开展商务活动。金融行业(包括证券)发展较快,对计算机信息系统和网络的依赖是百分之百的,我国数据通讯网络中60%~70%的信息量是金融电子化信息。

  中国经贸委、信息产业部和科技部共同发起了“企业信息化工程“,企业上网是该工程的组成部分。根据2001年9月初国家经贸委经济信息中心对551家国家重点企业及试点企业集团网站建设情况的调查,当前这些企业“触网”呈现出三个特点:一是大部分企业已“触网”,74%的企业已在互联网上建立网站或设有主页;二是不同地区的企业网站建设不平衡,中西部地区企业相对薄弱;三是网站质量良莠不齐。从上述内容可以得出一个结论,90年代以来,我国企业的信息系统建设,已经获得了长足的发展,这是不容置疑的。但是也要看到,这个最具升值潜力的信息行业,同世界上其他国家相比,我国还处在相当低的层次。

  国家统计局国际统计信息中心的研究人员,对世界二十个主要国家和地区(包括发达国家和发展中国家)的信息能力进行了测算和比较,结果显示中国信息能力处于最低水平之列。测算和比较是从信息技术和信息技术设备利用能力、信息资源开发与利用能力、信息化人才与人口素质以及国家对信息产业发展的支持状况等四个方面,选取了二十九个指标编制了信息能力指数来测算信息能力大小。结果第一是美国,信息能力评分是71.76,日本第二69.97,澳大利亚65.59居第三。

  中国只有6.17,是韩国的15.3%,是巴西的40.2%。美国哈佛大学理查德?诺兰(RichardNolan)教授提出了企业信息系统建设六个阶段划分理论,即初始阶段、扩展阶段、控制阶段、统一阶段、数据管理阶段和成熟阶段,该理论通称“诺兰模型”。按此理论,我国大部分企业处于前三个阶段。从上述的数据和国内外的比较,从诺兰模型理论,从到处都可以看到的全国企业信息系统建设的现状,从应用的广度与深度,得出我国企业信息系统建设处在初级阶段的结论应该是毫无疑义的。

  1.2我国企业的信息系统建设存在着数据基础薄弱问题

  按照诺兰模型,信息系统建设的第五阶段是数据管理阶段,其核心内容是“建立统一的数据管理体系”,“真正做到对整个机构的数据进行统一的规划和应用”。可见,数据基础建设已经是国际上衡量信息系统发展水平的一项重要标志,是我国企业信息系统建设脱离初级阶段向高级阶段迈进的关键一步。数据基础薄弱是我国企业信息系统建设存在着的一个非常普遍的问题。为了说明我国企业信息化建设中数据问题的严重性,特举《XXwanbao》20XX年10月16日报导的一个例子。今年“五一”黄金周,出游人数出奇地火爆,以致一些景区人满为患,一些地方住宿、餐饮、交通全面紧张。

  针对这种情况,从今年“十一”黄金周开始,国务院实行旅游预警制,也就是建立黄金周旅游信息统计制度和预报体系,通过媒体向全社会发布重点旅游城市住宿、旅游社接待、交通客运和景区等环节上的饱和情况,让消费者更加明智地安排旅游行程。旅游预警制本来是运用信息技术解决全国性问题的非常好的措施,但结果是:三大“致命伤”制约旅游预警。信息预报不够准确是此次旅游预警制的首个要害。一些景区在节前就已发布“饱和”、“客满”的信息,让想去那里游玩的游客都打了“退堂鼓”。而实际上,许多景区的实际进场游客只有其接待能力的一半甚至更少,生意反落得不如平常。如九寨沟、峨眉山、武夷山、黄山等。

  今年国庆,九寨沟就过高估计自己的游客量,在9月20日就提出“四限”游客的措施,广东的一些大旅行社闻讯立即抢订了九寨沟宾馆3000多间客房,但实际报名人数只达到预期中的1/10。下了订金的旅行社因此叫苦不迭,而九寨沟也唱起了“空城计”,从而造成了“有人唱戏,无人看戏”的局面。旅游预报信息的滞后性是此次旅游预警制的第二个要害。信息发布未赶上游客行程,夜间活动未列入统计数据。第一次预报到9月21日晚才公布,但很多打算出远门的人早在预报公布之前就已定好了计划和车票;旅行社方面其收客也已近尾声,他们都不会因为信息预报而取消行程。在“十一”期间,每天的信息都在下午5时之前统计出来了,对一些活动主要在夜间进行的景区如深圳的世界之窗来讲,这些信息就无法计算在内了。我国信息传送缺乏科学、准确,容易失真无法跟进是此次旅游预警制的第三个要害。据悉,旅游预警制并不是中国首创的,在一些欧洲国家,还有日本,早有类似的预警制度。

  他们在节假日中往各地派驻记者进行现场报道,并通过媒体不断地播放关于预订机票和住宿等旅游资源的信息,从而起到了很好的效果。但是它们一般都是发达国家,信息传送作到科学、准确、快速,游客往往能够根据预报的信息做出最佳决定。而中国的旅游信息预报因为设备等方面的局限,无法随时随地进行传送、及时跟进,因而操作起来比较困难。建立旅游预警制是发展我国旅游事业的一个非常好的措施,但由于数据基础问题,当前预警制在我国没有取得成功。

  旅游数据问题并非是个别例子,即使全国经济数据也存在数据基础问题。国家经贸委信息中心刘力主任讲,国家重点企业向国家经贸委上报数据的工作迄今已有四年。在国家经贸委上报中办、国办的各项信息中,重点企业信息采用率是最高的。但由于企业信息管理水平低,常有一些企业上报数据不完整、不及时、不准确,这些都严重影响了国家对重点企业情况的及时掌握。我国企业信息系统的数据基础问题集中体现在四个方面:(1)信息基础建设薄弱。其后果集中表现为:企业的基本数据和主要数据不全面、不准确,造成基础决策数据贫乏,影响各层机构的管理和决策。

  其原因在于,企业领导和建设者们,对我国企业面临的最迫切问题是信息基础建设,缺乏认识和重视,往往是好高务远;企业信息化建设中存在着技术因素,更存在着非技术因素,但对技术因素考虑得过多,对非技术因素估计不足,这里面非技术的因素却在起着主要作用。(2)企业信息管理水平低,数据管理混乱。其后果集中表现为:需要数据时难于检索,急用时查不到,只好重复向下面索要数据,反复编制报表。(3)数据处理和数据交换的规范和标准严重缺乏或者有而没有执行。其后果集中表现为:信息交流过程中,内部的数据不统一,交换的数据不能用,报表的数据格式不符合标准,影响企业、行业、地区直到全国信息统计的准确性。(4)缺乏企业内、企业间信息化的统一规划。

  其后果集中表现为:企业信息化各自为政,造成本来统一和一致的信息人为分割,数据共享程度很低,难以实现资源共享,无法开展电子商务。可见,我国企业的信息系统建设存在着普遍性的、严重的、不下大力气难于解决的数据基础问题,这是一个明显的不争的事实。

  2数据在信息系统建设中的地位和作用

  当前我国信息系统水平很低的主要原因之一是对数据在信息系统建设中的地位和作用认识不够。因此,首先应该从理论上、认识上解决问题。

  2.1数据是信息系统的原料、食粮、内容,是信息系统应用的前提,是信息系统价值之所在

  当前,我们大力提倡和发展信息技术,目的是什么呢?目的是为了快速、高效地处理和获取信息,为社会的发展服务。信息来自被信息技术处理了的数据。数据经过信息加工厂的加工,变成可以排序、可以统计、可以帮助决策的信息,才能真正实现它的价值,这便是信息化的作用,使其真正地产生经济效益。因此,数据是所有信息产生的基础,同样也是信息系统的基础,更是内容产业的基础。

  2.2数据是信息系统建设的中心、核心从信息系统的组成和处理流程

  可以明显看到,以数据为基础的数据库是构成信息系统诸要素的核心,信息系统都是以数据库为基础实现的;在系统的处理过程中,由各种数据组成的数据流,贯穿于整个处理流程的始终,一直处于中心位置。基于数据的这种特殊地位,美国学者马丁提出了以数据为中心的开发思想和以数据平台为核心的系统结构。数据平台不仅是系统实现各种功能的核心,也是系统可以长期稳定存在的基础。数据处于信息系统中心地位的另一原因是数据的稳定性,具有一个稳定的数据基础是建设信息系统最本质的问题。计算机硬件和软件由于设备的升级被更换,企业的数据处理过程在变化,工作人员不断流动,系统所开发的功能也会由于管理工作的变化而更换,但是其基本的数据却是稳定不变的。例如,对于电厂来说,无论管理方式如何变化,汽机、锅炉、人事、燃料、物资等部门的基础数据类型却是稳定不变的。稳定的数据基础对一个企业来讲还具备行业共性,对同行业的其它企业有参考和数据共享的作用。数据平台不仅是系统实现各种功能的核心,也是系统可以长期稳定存在的基础。

  2.3规范化与标准化是信息资源共享的必要条件

  规范化的数据及与之相关联的标准化的规定(编码、格式、词表、描述语言、置标语言等)、规则化的处理(流程、作业),是整个企业、全行业、全社会信息资源共享的必要条件。企业从生产到销售本来是一个有机结合的整体,但在非信息化的企业,其信息却处在一种孤立的、分散的、不连接、不一致、不统一的信息隔断的状态,信息不能共享。计算机技术提供了改变这种状态的可能和手段。利用信息技术,可以将企业的业务流程紧密地连接在一起,但要真正改变这种状态,则需要从数据着手,从数据同计算机技术的结合着手。目前,惠普拥有全球最大的企业内部网,12万5千名员工都可以通过网络取得统一的、标准化的信息和知识。规范化的数据及与之相关联的标准化的数据规定(编码、词表、格式、描述语言、置标语言等)、规则化的处理流程和作业,三者严密地组织起来,实行企业一体化的集成管理,使生产系统的接口数据和最终用户查看的交流信息,达到一致,实现设计人员、企业内部、企业间、企业与用户等相互之间信息的统一。实现异地、异构数据共享,避免大量重复性工作。实现多类型数据、多类型文献、多媒体信息、电子信息资源与网上信息资源共享。在网络环境下,使企业真正运作在一个Intranet-Internet-Extranet无缝连接的网络集成环境中,构造一个企业内、外信息共享和融合的环境。

  2.4全面、准确、规范的数据基础是进行深度的数据挖掘的前提条件

  目前在很多领域,数据挖掘都是一个很时髦的词,尤其是在如银行、电信、证券、保险、交通、零售(如超级市场)等商业领域。数据挖掘其实是一种深层次的数据分析方法。过去数据收集和分析的目的是用于科学研究,现在,更主要是为商业决策提供真正有价值的信息,进而获得利润。所有企业面临的一个共同问题是:企业数据量非常大,而其中真正有价值的信息却很少,因此从大量的数据中经过深层分析,获得有利于商业运作、提高竞争力的信息,就像从矿石中淘金一样。

  因此,数据挖掘是指:按企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,并进一步将其模型化的先进有效的方法。数据挖掘应从以下三方面加以考虑,一是用数据挖掘解决什么样的商业问题,二是为进行数据挖掘所做的数据准备,三是数据挖掘的各种分析算法。做数据挖掘研究的人,往往把主要的精力用于改进现有算法和研究新算法上。人们都知道数据准备是必不可少的一步,但很少有人去真正花时间和精力去研究。

  其实数据挖掘最后成功与失败,是否有经济效益,数据准备起到了至关重要的作用。数据准备包含很多方面:一是从多种数据源去综合数据挖掘所需要的数据,保证数据的综合性、易用性、数据的质量和数据的时效性,这有可能要用到数据仓库的思想和技术;另一方面就是如何从现有数据中衍生出所需要的指标,这主要取决于数据挖掘者的分析经验和工具的方便性。数据挖掘需要数据的全面和准确,数据分析算法要求数据具有一定的格式和规范性。无疑,全面、准确、规范的数据基础是进行深度的数据挖掘的前提条件。

  3巨灵公司在数据基础建设方面的实践

  为了夯实数据基础建设,20XX年巨灵公司花大力气对高新技术产品——金融证券期货类报刊检索系统主题词表和主题标引规则,进行了全面修订。经过半年的艰苦工作,现已修订出了《金融证券期货信息主题标引规则》和《金融证券期货专业主题词表》。同时与之相配合,编制了若干词表:信息类型词表、关键词表、人物词表、机构词表、上市公司词表(包括上市公司关联公司词表、公司更名情况表、易混淆公司表)和地区词表;相应,编制了若干标引细则:信息类型标引细则、人物标引细则、机构标引细则、审校工作细则和词表维护细则等。从而,形成了一整套主题词表和主题标引规则产品。在实践中,我们遵循了如下的一些原则:

  3.1以系统工程作为指导思想信息系统建设是一项复杂的系统工程。

  信息系统由5个系统组成,即:硬件系统、软件系统、数据库、规程和人员。数据库是信息系统的核心,计算机硬件系统和软件系统是信息系统的运行环境,人员和规程是信息系统的开发与使用的环境。对于这样一项复杂的系统工程,人们的认识是有一个过程的,我国企业信息系统建设的实践恰切地说明了这一认识过程。人们最早注意的仅仅是看得见、摸得着的计算机硬件;而后才了解到需要软件,进一步知道需要构成一个整体的计算机应用系统;再后体会到更需要既懂计算机又懂本专业的复合型人才;当信息系统投入使用之后,发现了过去没有或不大重视的数据和规程出了问题,成为系统真正实用的拦路虎,而且数据和规程问题既广泛存在又繁琐,同过去手工系统的工作搅和在一起,处理起来比购买计算机系统更难、更要花时间。巨灵人在实践中认识到了作为一项复杂的系统工程的信息系统建设,必须重视数据的重要性,认为数据就是系统的生命。

  为此,有三条系统建设的具体指导思想是公司领导一直强调的:(1)数据库是系统的核心,要求数据库的设计能支持公司产品的可持续发展;(2)主题词表和主题标引是报刊网络系统的生命线,要求研究所配合报刊部,一定要搞好主题词表的更新和标引规则的制定;(3)信息系统一般都从单项应用系统开始,逐步向综合应用系统过渡,这是一个从量变到质变的过程,我们不能用项目级或程序级的经验去指导系统级的建设。组成信息系统的5个系统既涉及技术系统又踏足社会系统。计算机硬件系统和软件系统作为运行环境,强调了信息系统是一种技术系统的特征;人员和规程作为开发与使用环境,则强调了信息系统是一种社会系统的特征。长期以来的偏向是,人们往往只注意到信息系统的技术系统特征,而没有注意到信息系统的社会系统特征。为此,公司强调:(1)系统设计必须有专家和相应业务人员的参加和评议;(2)吸收最终用户的意见;(3)在实际使用中不断信息反馈和改进系统。

  3.2数据的总体设计

  在进行数据的总体设计时,数据被作为一种独立的资源来对待,并被看作是支持所有应用项目的基石,以系统的整体最优为目标。在金融证券期货主题词表经过一年多的试用和主题标引经过一年多的实践后,我们收集了各方面的反映,并试图采用总体设计的原则,进行全方位的修订和制定,以达到系统的整体最优目标。修订的做法和过程是:(1)对原系统进行总体上的调研和评估:经过对原系统的全面而实际的了解,特别是征求从事实际工作的员工们的意见,认为报刊检索系统的总体设计是合理的,系统实施的进度较快,目前已初步实现了规模性生产。但是,在某些环节上存在有问题,这些环节主要是:各种词表(主题词表、关键词表、机构词表和人物词表等)、标引规则、标引方法、人员培训等方面。

  这些问题反映在实际工作中表现为:主题词表选词不当、不规范、不完善;标引工作缺乏共同遵循的规则;信息加工耗费人力和时间过多,必须尽快发展系统的自动化;系统实施的正规化和规范化程度较低,急需改进和提高。(2)狠抓影响全局的关键环节:金融证券报刊数据库建设首先必须夯实数据基础,鉴于当前各种词表、标引规则和标引方法问题,已经成为了影响系统全局的关键环节,我们重点抓了主题词表和标引规则的修订和制定。(3)从整体上设计和修订主题词表:以金融证券专业主题词表的修订为主,作为专业词表整体,同时设计和修订关键词表、机构词表、人物词表和系统专用的信息类型词表。这多种词表应构成为一体化的、有机结合的一整套金融证券专业性的主题词表。(4)从整体上考虑和制定标引规则:以金融证券专业主题词的标引为主,作为标引工作整体,同时考虑和制定关键词、机构、人物和系统专用的信息类型的标引规则。这多种标引规则应构成为一体化的、有机结合的一整套金融证券专业性的主题标引规则。(5)建立词表和标引规则的不断更新机制:制定了《词表维护细则》,规定了词表和标引规则的维护措施,以确保未来词表和标引规则的不断更新。这样,不仅在空间而且在时间的延续上保证了词表和标引规则的新颖性。

  3.3数据规范化及其处理的规则化

  (1)词表和标引规则的修订遵循和参照国家标准:按照国家标准规定的文献主题结构模式,从主体、通用、空间、时间和信息类型等五项因素,全面反映金融证券报刊文献的内容主题;同时,又结合金融证券专业的特点,加强机构,特别是上市公司的揭示和信息披露,使修订工作既符合总的标引原则又结合报刊检索系统实际,使报刊系统能够同全国的信息系统并轨,又有自己的特点。

  (2)形成全公司的信息工作标准:作为一个专业性很强的信息公司,词表和标引规则是可以通用的,因此修订的词表和标引规则将逐步成为全公司的信息加工工作标准。

  (3)修订的词表可供全行业参考:在金融证券行业目前没有可供使用的专业主题词表情况下,巨灵公司编制出的主题词表可供金融证券整个行业参考和使用。

  3.4词表和标引规则的系统化和可操作性

  (1)词表和标引规则的系统化:修订的词表和制定的标引规则不是个别的、孤立的,而是主题词表和其它相应的多种词表相互结合,标引总则、分则和多个细则的有机配合,形成了系统化,构成了实用的词表和标引规则体系。

  (2)确立了词表维护体系:作为标引总则的补充和细化,编制了《词表维护细则》。在《细则》中说明,词表维护是指“对本系统现有的各种词表,为保证其新颖性、正确性和权威性,进行增加、修改、删除以及调整主题词之间关系的不断进行的过程”;具体规定了对新增、修改和删除主题词的处理方法、审定权限和词表更新办法,即“分别按各自的词表编制规则,处理、编排和汇入到相应的词表中去,完成了一次各种词表的修订工作”,永葆主题词表的新颖性。

  (3)强化词表和标引规则的可操作性:为了在全公司推行标准化,必须使主题词表和标引规则具有可操作性。为此,在修订和制定中,对需要进一步说明的各项操作细节,均要求以附件(细则)的形式一一列出。配合标引总则,我们编制了以下几方面细则:信息类型标引细则、人物标引细则、机构标引细则、审校工作细则和词表维护细则。

  3.5手工与自动化规范保持一致性和可过度性

  在标引规则中,规定了手工与自动化两种标引规范必须保持一致性和可过渡性,统一手工和自动化两种标引方式的主题标引规则,为报刊系统逐步过渡到自动化标引,提供了统一的规则和过渡的条件