大数据知识普及.ppt
《大数据知识普及.ppt》由会员分享,可在线阅读,更多相关《大数据知识普及.ppt(35页珍藏版)》请在课桌文档上搜索。
1、大,数据,Big Data,大数据,什么是大数据,Hadoop,IBM,英特尔,HP,数据,商业智能,数据库,服务器,SAP HANA,NoSQL,SQL,HDFS,预测,数据流,运算节点,机器学习,并行计算,磁盘阵列,甲骨文,AMD,内存计算,Google,Map reduce,可视化,Gb,Pb,Tb,Zb,大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯,大数据的目的,原始数据的处理和分类存储,将存储的数据调取并分析,最终提供决策依据,归类数据类型,有效分析组合,
2、大数据的特点,4V,海量,高速,多样,精确,1 KB=1024字节,存储单位,1 MB=1024 KB,1 GB=1024MB,1 TB=1024GB,1 PB=1024TB=1,048,576 GB,1 EB=1024PB=1,073,741,824 GB,1 ZB=1024EB=1,099,511,627,776 GB,100万 G,10亿 G,1万亿 G,22亿台,215万台,2100台,500G硬盘电脑,15寸电脑排成行可以往返一次月球,Volume 海量,1 PB=1024TB=1,048,576 GB,1 EB=1024PB=1,073,741,824 GB,1 ZB=1024EB
3、=1,099,511,627,776 GB,Intel:人类文明开始到2003年 地球共产生了5EB数据.,2012年全年,全球产生数据2.7ZB 是 2003年以前的500倍,2015年,全球估计产生数据8ZB,等于1800万个美国国会图书馆,44%,35 ZB,2000年 数字信息占全球数据量的25%75%都在报纸 胶片 磁带等媒介2013年 数字信息 98%非数字信息 2%,商业数据现状,Twitter,2007年 5000条微博更新/天2008年 30万条微博更新/天2009年 250万条微博更新/天2010年 3500万条微博更新/天2011年 2亿条微博更新/天2013年 4亿条微
4、博更新/天,2013年 上传时长12年的视频/天,2013年 用户分享25亿条信息/天,我国一个一线城市的健康档案数据 5PB/年我国一个智慧城市的数据 800 PB/年,一个单数据表几亿-几百亿条记录下线商品14亿件,在线商品8亿件淘宝数据库存了20PB数据平均每月增加1.5PB,智能移动终端设备的巨量增长,Velocity 高速,6000万用户登录/天20亿次 页面访问/天每天1.2亿次网站访问 响应时间小于100毫秒,大数据的惊人不止是在数量上,同时数据还是巨量具有动态分析价值的数据。访问响应时间的加快,数据库读写速度的加快,对电商企业来说就等于多成交。对于很多情况下,动态的数据价值远大
5、于静态数据,比如气象预测,灾难预测,快消行业等。,由于输入速度加快,所以要求输出速度也要加快,Variety 多样,数据:,结构化数据,半结构化数据,非结构化数据,指关系型数据表,指关系结构与内容混合在一起的数据类型,文档、视频、音频、图片,20%结构化 80非结构化,企业数据,2012年互联网产生的数据,25%结构化 75非结构化,50%-70%源于人与人的互动,Veracity 准确,大数据的核心思想之一,准确源自于对全部数据的处理分析,基础数据的真实准确性,才能保证结果的有效性。,大数据 VS 云计算,两者都是生产方式改变为主,生产资料改变为辅,提高生产效率。,云计算是将计算和存储,由本
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 知识 普及

链接地址:https://www.desk33.com/p-248189.html