创造性地认识和掌握开源信息 提升开源信息时代的自我修养.docx
《创造性地认识和掌握开源信息 提升开源信息时代的自我修养.docx》由会员分享,可在线阅读,更多相关《创造性地认识和掌握开源信息 提升开源信息时代的自我修养.docx(10页珍藏版)》请在课桌文档上搜索。
1、一、什么是开源信息数字经济时代,陆海空天的点点滴滴都是开源佶息,都能在网络佶息空间追寻到蛛丝马迹,都能在数据的海洋中捕捉到这样或那样有用的信息,说“我们处在一个互联网(Internet)信息横向传播的社会“,说“网络没有秘密”、“数据库是人类经济社会发展的信息知识宝库”等,都很有道理.一般来说,开源伯恩被认为是所有公开或半公开的信息,无论是网络公开、印刷纸媒公开、还是相传公开.严格地说,凡是能钙通过计算机系统搜索、依索、收集到的数据信思,都属于开源信息,开源信息Opensourceinformation)也可译作开源t报.英文单词information.既是信息、消息的意思.也是情报、资料、资
2、讯的意思,传统的依梭“保密情报的“秘密文化”惯性,班者计算机网络系统、大数据知社交媒体的爆炸性发展,早已被碎片化并寻觅网络数据化规则重纲或重新集约。基于创造性、批判性地思维收集、分析、利用开源信息,已经成为国际政界、商界、企业界、情报界的主流工作.“凡金钱交易之处必有信息交易”成为常态”数据开源世界没彳j秘密,以往被认为秘密的都被有意或无意地公开公开的就是秘密从而,信息就是情报,且具有快捷、多元、多样、海量、精准等特征。开源信息已经成为影响经济、社会发展和决策的重要来就、主要来源.基本来源.二、开源信息哪里来?因特网由明网、深网和暗网三个层面构成.明网(SurfaceWeb)是普通拽索引擎可以
3、检索的网络,约占总体结构的4%。深网(DeepWeb)是不能被普通搜索引擎检宗到内容的网络.约占总体结构的96%,共中需要通过特定的浏览器、特殊授权或者特殊设置才能链接的网络被称为暗网(DarkWcb).暗网充斥毒品、军火、伪造证件、洗钱、倒卖数据情报等非法交易。源网的内容约是明网的500倍以上。美国司法部和FBI起诉我国某省国安官员时称,全部的线索情报(SIGINT)和搜杳证据都来自于网络开源情报.与美国共同构成因特网监管(Intcmctsurvc1.IIancc情报联盟-五W1.fr(FVER)的澳大利亚、新西兰和加拿大,V已公开宣称将利用开源信息情报共享揭微*IUfH1.iX-.美国国防
4、部、国家安全局等认为,80%以上的情报来自开源信息,美国基于因特网(Inteniet)的赛博空间(Cybcepacc)主动防御体系,就是对网络数据进行广泛.深入的开源信息分析与整介.自动检测威胁(具威胁性的情报数据信息),并及时(告警)响应(反击),包括但不限于先发制人的网络行动,2()01年“911”事件之后,笑国公开组建网络故略机构、加强网络战略力计,困绕开源信息情报的收集、处置和应对,开始了有计划、有目的大力投资、训练和创新拓展。美国2003年启动的“爱因斯坦汁划“,2008年启动的“变哈顿计划”.实际上都是基于揖视开源信息情报的数据战、信息战计划.从根本上转变了冷战时期的“秘密情报”思
5、路和方法.美国2013年4月全面启动的第三阶段“尔因斯坦计划”(E3A),立足于提高国家网络安全防护系统(NCpS的网络监溺及主动出载能力,为从开源信息中及早发现未知的网络攻击.协同政府部门和民营行业的新技术研发提供了一个平台.同时.美国国会强制性要求所有联邦政务部门,在2016年底之前加入E3A计划.美国所有的军小、情报部门和多数智阵、科研机构,都有自己专门负货搜索、监控、观察、福理、分析、存储开源信息的团队,少则几卜人,多则上千人。开海信息搜索、归纳、分析、存储系统各有不同,一般都是各团队(部门、机构)自行开发、自行规范、自行设置保护措施、自行决定利用目的和方法.不同团队(部门、机构之间交
6、换、索取对方或他方经过整理(能选、过沈、分析)的开源信息,都是由合同制约的有傍服务,政府也不例外(投资或购买)。非合同约定事项,均不得泄露与棍供.三、曳视开源信息,开拓创新思维收集、整理、分析开源信息,是创造性地加演人的思维活动多与数据世界创新的过程,需创隹全新的人机合作系统。应当注意,新系统的研究发展方向,是对看上去不确定的模糊事物(杂乱信息).依靠(经过训练的)人的创造性思维梳理解决.机械性分析做容易落入陷阱和迷境.专业的人做专业的事.专业的出队成就创新的专业.信息社会,收集信息已不是问题,正要的是验证信息,科学是蛤证、试错的过程,裟证信息是对信息链的科学归纳H1.分析,不是简单地认定或推
7、定“是与“非”,“对”与“错”、”好”与“坏”、证”与“负”.通常来说,专业团队对于开源信息的收集和搜索都有专门的目的,进而进行专J归纳和分析,做出信息进完整的验证和与日的吻合与否的判断,提交(供)最终决策,因此,殂建和掌握一支警于及时获取开源信息的团队是关键,般证信息的科学能力是保证开源信息价值的基础.领导者应当善于发现、大胆启用和全力保护团队的领军人才和什干人才.据2018年战略前沿技术网发表的署名张策的文章力迈向开源信息为披露.美国国家情报总监办公室倡议的高级情报研究项目活动(IARM,引发了情报预测项FI“G佳判断”的激打竞争,2011年开始的第阶段高级情报研究项目活动,主要探索开源信
8、划的情报潜力。结果,没有获得传统分类保密信息的人.比可以看到截获信息和秘密数据的专业情报人员.平均预测准确率高30%.“最佳判断项目的多个比呢结果表明,当人们参与一个只奖励判断结果准确性而无需考虑判断理由的新颖性,或对某一党派观点的认同性时,预测的准确性是可能实现的,这样的比赛既能激发人的创造性思维又能培养批判性思维。文余认为,未来能成功地根据可能导致冲突的模棱两可线索得出正确的判阍.并将通过创造性地分析问虺和耨断阐明解决方案的细致过程来实现.在提高创新思维和灵活地利用开海信息方面进行有针对性的投资,将会给领导层决策提供巨大招助,并将使情报部门在未来情报信息领域竞争中形成超前优势。技术发展带来
9、信息的板大丰富.除了传统媒体,互联网的出现择放了巨大的数据饰存库.而社交媒体提供大讥实时的用户生成内容,数据分析的进步显著增强了大型数掘染的处埋和解择能力。科学研究的范式不断变迁,从最初的归纳和演绛两种方法,发展到仿真模拟,到后来大数据成为重要的研究手段,而现在人工智能的快速发展,又成为了新的科学研究方法,有人将此称为科学研究的第五种范式.身处海疑信息的浪潮之中,现代人僭要具备的一项Hi要素并,就是信息素养。具体表现为:如何构隹起自己的知识体系,如何获取有价值的信息,如何辨别信息的真伪以及不同信息之间的关联.如何不被海量的信息淹没雯挟成为“流量”和“韭菜二如何正确了解和把握自己所处的环境、行业
10、与世界,如何对自己感兴趣的问时或者某些特定的领域有深入的研究,如何贡献有价值的信息和观点是短天被各种无序的信息李菁舁子走,还是带苻自己的主体性在有意识地获取、分析和处理信息,将从根本上决定一个人的发展与未来.某种程度上也决定了一个人的认知力、停受力和生活的幸福感.如何提开信息素养,是一个庞大的话鹿,涉及到人生理念、价侑追求、思维方式、行为习惯、工作生活方式方法等各个方面。这里只想探讨一个话题,就是如何分析开源信息,进而如何利用开源信息做一些深入的研究?所谓开源信息,就是从公开渠道可以犯到的各种信息.最初这个词用在军事情报领域.后来在互岷网领域汨到广泛的应用。而W实上,开源信息对我们各个领域来说
11、,都是客观存在的,也是我们普通人所能得到的最多的信息来源,在这方向,毛泽东主席可以说是光辉的典范.他在年轻的时候就通过收集阅读公开发行的报刊,了解和分析世界大势.在革命战争年代和建国以后,他更是身居一室,眼观天下,指点江山,运筹摊眠,体现了常人嫌以企及的信息分析和处理能力.对大部分普通人来说,学习和掌棍一线基本的开源信息研究方法,对于提升自己的认识能力,增强自己对社会问跑和行业等方面的洞察,都是大有律益的.其中很成要的一点,就是让自己在众声啜哗、泥沙俱下的信恩环境中保持良好的辨别力,不至于见风就是雨,别人说啥就信啥,而能携守脑如玉这个看起来很戏,其实做到也确实不容易,不是有很多学历很高、职位很
12、麻的人也常常在这方面跌跟头吗。如何做好开源信息的研究分析.我结合向己以往的经脸体会,在这里提供一个基本的方法和步骤.大致分为五步.第一步,是对要研究的领域建立拓本的知识框架,井在一定时期内具有相对稳定的思想观点取向,同时时开源信息的分布和来源有结构性的把树,第二步.是信息的收集获取,针对自定义的主题,从多个信息源持续采集最新的开源信息.聚合储存为自有数据库,这需要用到一些技术工具,如搜索引架、爬虫等.第三段,是信息的评估,建立自己的可信分析系统,从知识、语义、传播模式、信源等不同的角度,分析信息的含金量和可用性,.取点是识别信息背后的利益和立场,以及把事实和观点及情绪分开.第四步,是对信息进行
13、分类和遴选,也即预处理,将可用信息分门别类,根据共门类、大小逻辑关系、可用性的强弱等,做必要的标注,建立知识图谐和信息树,并持续迭代,第五步,是信息的应用,根据特定论造的需要,采取定性或定量的方式,对初始信息进行提取、转化、改造和组合.形成为自己的观点,用自有的观点体系统合相关素材,进而构建所关注领域的底层逻辑和脉络框架,然后从中提炼核心关城及前沿命题.作为进一步思考和研究的超础,在这方面,我有很深的体会,也有很多实际的案例,今后可以详细诉说。简要回顾的话,大致经方了一个从自发到自觉的过程.大学时我学的是文学,但对哲学漉兴趣,所以大学期间除了浏览文学作品外,阅读曳点放在了中外思想史和历史研究方
14、面,应该说构建了菸本的知识底座和思维方法,第一价工作是当了两年记者和编辑,工作之余阅读了大埔的社会学和人类学著作,建立/我观察社会的基本视角.研究生我湾专业读了新闻传播学,我一边读书一边实践.广泛涉猎了社会科学的各个领域,写出了7万名字的聘学科优秀硕士论文。而且瓶时我就自信地认为,不防要再读什么即士了。硕土毕业工作之后,我花了一段时间做所处的能源行业的研究,从一个完全的门外汉.到对这个行业有比较系统、历史和酋腔性的认识和研究,提出过些比较有预见性和启发性的观点,在行业内得到比较多的认可。当然,我不需要去掌握里面具体某一个环节的技术细节,而更多的是从宏观的、立体的角质去把握这个行业的结构性内容和
15、发展趋势,尤其是跳出具体门类的“登井式”视角局来(也包括我中陷含的特定利益立场,而对大的能源行业彳!全面的认识.惟其如此,才能0正把俎一个领域的底层遗辑和核心翁鹿。由此从行业研究拓展到公共政策研究和战略研究,才是可能的。在这个过程中,我就是按照开源信息研究的方法去做的,而且经历了一个从模糊到清晰.逐渐建立起方法论和可行路径的过程.后来我时能源研究的兴趣有所减弱,一方面是觉得这种真正意义上的研究,社会似乎并不需要。要做那种命题式的官样研究,我又确实没有兴趣,(当然我现在还会深度思考行业的问题,完全是为了满足好奇心和对知识的兴趣).但是这个过程,对于建立自己的研究方法体系是非常曳要的.如果说它是“
16、居龙术”,那我用它来对付一些小问胭,自然是不在话下,状至有如武侠小说书描述的“飞花摘叶,皆可为剑叱另一方面,因为偶然的原因,我涉足写作额城,结合自身的经历,对写作这件事做了系统深入的研究,从最底层出发.构建起彳!效的方法体系.写作会涉及社会的方方面面,不同的年龄,不同的群体,不同的用途,其中很多原理和方法是相通的,我很欣慰自己在这方面还是帮到了很多人,另外,因为工作涉及到党建、企业的管理等领域.由于这种思考方式已经内化为自己的习惯,我自然会有意识将其运用自己的工作领域,建立起自己对这些领域的积崇和知识体系.当然,这种思考与纯客观的行业研究又有,所不同,它是一种“将自己作为方法”的研究方式,一种
17、带有阳野性精的观察和思考.因为自身作为主体的在场,必然带入主观的呼受、情志与认知.是一种偏理于防性而非1.it化的研咒.魏杵哲学家王弼有句话,“应物而不累于物二在不同的场域中,如果有稳定的内核,有能化容万物的内在,那么所有外物都是磨砺你、启发你、成就你的素材,都会因为与你的生命相遇而成为你生命的一部分。这样的时候,心态就是从容的.眼光就是超越的,胸怀就是越来越拓展的,这也就是“君子不备”的真正含义.人生有几十年时光,可以做很多有意义的小情,但前提是认识自己,了解自己,不察负上天的赐予和自我的修炼,寻找到人生的价值目标,付出持续不断的努力。哈佛大学的小桑他尔说.人生要有真正的幸福.应该从目标导向
18、性活动切换到自我导向性活动上来,包括自我掌控、迫求高尚的友谊和亲近自然.在追求幸福这一点上,其实古今中外哲人的底层送彩都是一致的,孔子的求仁得仁,王阳明的致良知,稻谦和夫的敬大爱人,金惟纯说的人牛.只为一件事,以及小桑德尔,等等,这些人都经过了很深的思考和人生的广泛阅历.最终都落脚到在一个混乱的社会中如何自处、如何安顿内心这一点上.他们给出的答案和启示也都殊途同归.如果我们进入自我导向性活动,找到自我联动的力求,就会由此感到拿桃那对于我来说,就是立足于前人的内膀,用好数字化时代开源信息的优势,不断思考和研究,力求有所创造和贡航.为此我会投入一些长期性的研究课遨,我觉得它们是曳要的,也是自己鳍兴
19、鲤的,这样才会乐意去做,这不仅仅是依舔“坚持”,中国需要建立自主知识体系,但是有那么多重要的问即无人问津,其中有很深刻的原因。但对于个人来说,只要H拱一卒就必有成效.我们常常会高估短时间内做一件事能达到的高度,也常常低估长时间内做一件事能达到的高度。而时于一些有价俏的问璃而言,长时间的研究、思考和沉潜是不可少的。对于大部分人来说,不一定会去检什么研究,但薛于对开源信息利用和分析,也是数字化时代的一项重要能力.毕竟,人工智能时代,器灵光一闪,靠抖机以,而没有自己的认知与价值体系,没有对些货物形成自己的观点和看法,不具法时信息,进行加工处理和抽象提嫌的能力,其结果就是被机器所取代.你准存好了吗?附
20、参考资料:国外互联网开源信息处埋研究综述互联网开源信息处理是指从互联网上的公开信息源获取数据并分析处理,进而获得有价假的开源信息的过程,为充分了解国外互联网开源信息处理的研究现状,从开源数据聚集、预处理、信息分析、决策支撑、相关系统等角度对近年来国外有关研究进行梳理.总结现行研究存在的普遍性同2,对未来研窕进行展里.的若全球数字化、信息化进程的深度推进,互联网逐渐成为人类G近要的基础设施之一,承栽了涉及人类生活工作方方面面的海量信息.与此同时,互联网的普及极大简化了从门户网站、社交媒体.恻客等公开信息源获取信息数据的过程.这些开源信息数据可为人们提供有价值的决策支控信息,帝助人们更好地认知、埋
21、解甚至预测特定实体或概念对软的属性利行为,进而掌握“件的规模、热度、发展趋势等。为此,互联网开源信息处理逐渐成为世界各国争相研究的热点.互联网开源信息处理(以下简称“开源信息处理”)是指从互联网上的公开信息源获取数据并分析处理,进而获如有价值的开源信.&的过程.开源信息处理中涉及的估息范围十分广泛,涵靛了政治、军步、商业、社会等众多领域,在政治摘域,开源信息处理可以用于分析其他国家的政策和决策,帮助决策者预测目标国家的行为趋势,在商业领域,开源信息处理可以用于分析竞争对手的战略和市场趋势,帮助企业制定更好的市场营销策略.在社会领域.开源佶息处理可用于分析犯罪活动和社会趋势,帝助执法郃n和政府机
22、构制定更好的政策和措施。本文将对国外开源信息处理的有关研究进行综述,包括开源信息处理的定义、技术手段、应用系统等,总结现行研究存在的何处h提出未来可能的研究方向.旨在为有关领域的从业人员提供一个可参考的系统性知识框架,助力开源信息处理技术发展.I技术流程开源信息处理的主要技术流程包括4个部分,分别是数据枭集、数据预处理、信里分析和决策支撑,如图1所示.Qtj(用户D侑2反送彳?决策支撑信息统计杳询检索%报告生成信息分析粕则利断机器学习复杂网靖故燃我征WTW加WiM数据去嵯4Gm1.I心嬴样本WBdK值处理数据过滤影喟瑞UI毋UW体也征对抗生或c(ai?图I开源信息处理主要技术流程是数据采集,是
23、指从互岷网公开数据源采集信息数据,为开源信息处理分析提供基础数据支撑,聚集的信息需要经过初步加选和过滤,以保证基本的数据准谛性和有效性,避免采集资源浪费.数据预处理是指对采集到的开源数据进行分析前的预先处理.二是数据值处埋,其目的是在于提高数据的原量和可用性,以便后续分析能膨更加有效地利用,常见的按处理包括数据清洗、格式转换、数据虫构和存储管理等,能弱使数据更加规范化,降低数据冗余和错误。三是信息分析,指利用分析修法对预处理数据进行深度的统计、分析和判断,从中挖耨出有价值的信息和规律.生成行价值的决策支掠信息,为用户决策管理提供信息支掠.是开源信息处埋整体流程中的核心环节.四是决策支择.指将分
24、析的结果通过合埋的方式传递给用户,方式主要包括信息可视化、报告生成和信息共享,以便用户更好地理解和使用决策支推信息,2数据采集2.1 人力整编人力整编也称众包数据收集,是指通过数据工作者手工收集、完善和优化从公开数据源获得的数据的过程,人力整编的优势主要在于通过引入9家知识,一定程度上提高数据质琼.对于轻量级的数据采集工作能好保证数据采集和管理的效率.然而,人力整编面临数据隐私安全、人为偏见、众包质房参差不齐等问应.Chai等人在其综述研究中提到,众包数据库系统健就有效解决现有公共众包平台(如AmazonMechanica1.Turk.CrowdFIower等交互设计非常不便的问映该综述对众包
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 创造性地认识和掌握开源信息 提升开源信息时代的自我修养 创造性 认识 掌握 信息 提升 信息时代 自我 修养

链接地址:https://www.desk33.com/p-1635994.html