“神人”or“闲人”?你的未来由AI与大数据决定-程序员宅基地

640?wx_fmt=png


12 月 6 日,北京新云南皇冠假日酒店,由中国计算机学会主办,CCF 大数据专家委员会承办,CSDN、中科天玑数据科技股份有限公司协办的 2018 中国大数据技术大会(BDTC)首日议程圆满结束。


本次大会为期三天,共设置有 1 个 Keynote 主题演讲,13 个分论坛,共有超 140 多位海内外技术专家及知名企业、高校、科研院所代表组成的实力讲师团、上千名技术开发者参与,他们聚焦大数据学习发展中的痛点及瓶颈,深入解析热门技术在行业中的实践和落地,紧贴时代脉搏,开启了一场属于技术人的年终盛宴。


大会首日上午,参加议程的大会演讲嘉宾有:


  • 阿里巴巴集团副总裁、2018 中国大数据技术大会主席 李飞飞

  • 中国科学院院士、北京理工大学常务副校长、CCF 大数据专家委员会主任 梅宏

  • 华东师范大学副校长、教授、博士生导师、2018 中国大数据技术大会主席 周傲英

  • CCF 大数据专家委员会副秘书长、北京永信至诚科技股份有限公司高级副总裁 潘柱廷

  • 中国科学院院士、西安交通大学教授、清华大学双聘教授 管晓宏

  • 源码资本投资合伙人 张宏江

  • 美国俄亥俄州立大学教授 张晓东


圆桌论坛:大数据与数字经济发展趋势


  • 主持人:CSDN创始人&董事长 极客帮创投创始合伙人 蒋涛

  • 嘉宾(排名不分先后):

  • 美国罗格斯-新泽西州立大学正教授、百度商业智能实验室主任 熊辉

  • 美国俄亥俄州立大学 Robert M. Critchfield 讲席教授 张晓东

  • 联通大数据有限公司总经理 赵越

  • 阿里巴巴集团副总裁 李飞飞


上午 9 点,李飞飞、梅宏和周傲英做了大会致辞后,上述海内外产学研界的重磅嘉宾陆续做了大数据技术和趋势发展分享,最后四位嘉宾在圆桌论坛上就大数据与数字经济发展趋势进行了热烈讨论。以下为诸位技术专家演讲的精华内容,由 AI科技大本营整理:


七大技术权威亮相主会,指明大数据时代新趋势


潘柱廷:大数据已成为所有新旧技术的必备基础


640?wx_fmt=png


他介绍了 CCF 大数据专家委员会对 2019 年大数据发展的十大预测,并从学科、技术、系统、应用等方面进行了详细解读。在大数据应用领域方面,医疗、智慧城市、金融应用比例排在前三位;数据类型方面,城市数据、视频/语音数据、互联网公开数据占比依次最高;数据获取及资源流转方面,企业还是会选择自己收集数据提供服务;数据科学、人工智能、智能计算仍是大数据的最佳拍档;大数据发展的主要推动者还仅来自于大型互联网公司和政府机构。


潘柱廷指出,绝大多数参与调研的专家学者认为大数据发展仍处于快速扩展期。另外,从辅助到引领,从热点变支点,大数据和数据已经成为所有新旧技术、新旧模式的必备基础。


管晓宏:数据驱动信息物理融合系统信息安全


640?wx_fmt=png


管晓宏提出,CPS(信息物理系统) 被公认为下一次工业革命的重要基础,无论是德国提到的工业 4.0 还是美国竞争力计划,都表明建设大规模信息物理基础设施是国家重大战略需求。同时他指出,信息物理融合系统安全监控面临三重挑战:如何建立针对 CPS 安全的模型,如何利用 CPS 多源数据的关联关系,如何处理 CPS 异构大数据。


管晓宏表示,CPS 基础设施的安全是事关国民经济稳定发展和国家安全、信息安全与相关交叉领域的重要发展方向;CPS 安全通常涉及综合安全,解决 CPS 安全监控需要深入了解物理系统的结构与特性,需要多学科交叉和通力合作;CPS 数据是典型多源异构大数据,而物理-信息数据的关联融合是解决 CPS 安全问题的重要手段。


张宏江:AI 再风光,核心依然是数据


640?wx_fmt=png


张宏江表示,今天 AI 第三次浪潮来得如此之快与猛,背后的驱动力在于大数据、强计算、新算法的改良与突破,并且缺一不可,比如即使有再好的算法,但如果计算量上不去依然无法实现 AI。今天 AI 能获取的数据精度已经远远超过人类,这背后的核心是计算力的提高,更重要的是数据量与质量的提升,算法的精度和数量正相关。 张宏江警示称,AI 再火再风光,背后的核心依然是数据。


今天乃至未来 AI 到底到什么地步?张宏江概括为辅助人、代替人、超越人。对于最后一点也许心理上还有些难以接受,比较极端的说法是这个世界上将只有两种人,即神人与闲人。


张晓东:后摩尔定律时代需明确未来系统特性


640?wx_fmt=png


摩尔时代过渡到后摩尔时代究竟遇到了怎样的挑战?张晓东认为,本质上明确未来系统的特性十分重要。 未来所有的计算放到 Memory 当中,也就是 Memory IN Memory,将会有 NVM 和 BDTC,也就是 CPU 变成了 New Memory。这需要年轻软件工程师们必须做出一个新的生态环境,最终用户说一句话就能让计算机做出相应反应,系统则会自动调用适合的 GPU 来接手工作。


熊辉:AI 时代缺乏跨界型人才


640?wx_fmt=png


熊辉提到,数据驱动的人工智能时代,一定要考虑到技术、数据、应用场景之间的三角形循环。在中国,当前落地最大的问题是缺乏跨界型人才,人才要有非常丰富的专业支持,且技术要强,不然根本不知道哪些应用问题可以被解决。


李飞飞:大数据结合实体经济非纯技术领域问题


640?wx_fmt=png


李飞飞表示,大数据与实体经济的结合已经不是一个纯技术领域的问题,这其中牵扯到对传统行业的改造,比如数据源打通、行业系统升级改造等,我们需要考虑以最少侵入式的改动使传统行业接收数字经济的理念并享受到相应好处。


李飞飞也分享了自己做技术的经验,技术浪潮会不断涌现,而且技术发展迭代非常迅猛,我们需要以兴趣来驱动而非目标驱动,找到自己最感兴趣的技术,将其做深、做透。


赵越:大数据实践最主要的是挖掘数据价值


640?wx_fmt=png


赵越表示,经过几年的大数据实践,最大的挑战主要还是怎样从庞大的数据量中发掘价值十分关键。 如何把数据变成价值需要耐心,并学会高效与产学研结合,也更需要真正的大数据人去挖掘。


上午议程结束后,北京理工大学常务副校长、CCF大数据专家委员会主任梅宏院士和华中科技大学金海教授亲临现场进行签名赠书,现场气氛火爆异常。


640?wx_fmt=png

     

七大业界专家纵论应用,阐述大数据技术落地思维


本次大会聚焦于大数据技术如何更好的服务于实体经济,关注热门技术在行业中的实践和应用。而下午的重磅演讲嘉宾则清一色来自产业界,主要围绕大数据技术的应用落地。从其演讲内容来看,某种程度上,他们为“从辅助到引领,从热点变支点,大数据和数据已经成为所有新旧技术、新旧模式的必备基础”提供了绝佳注脚。


以下为参加下午议程的演讲嘉宾:


  • Alluxio 公司创始人、CEO 李浩源

  • 阿里巴巴集团副总裁 周靖人

  • 普元软件产品部总经理 王葱权

  • 北京信息科学技术研究院副院长 陈性元 

  • 京东云生态业务部高级总监 朱冰

  • 中移软件大数据部总经理助理 王宝晗

  • 易观 CTO 郭炜


李浩源:统一化分布式虚拟文件系统


640?wx_fmt=png


数据时代最重要的资产其实是数据本身,但最重要的任务在于如何最大化、最有效地从数据中提取价值。


李浩源指出,数据生态初期的 1.0 架构面临着三大痛点:复杂、低性能以及高成本。而大数据时代的 2.0 架构则提出了整合数据、Memory-first、Native APIs、Multi-hybrid Cloud 这四点需求。曾经整个存储行业都在重复同一个故事,每 3 至 8 年就会有新一代存储的软硬件诞生,随着上一代的不断革新,自然数据的环境也日益复杂。面对挑战,他们提出了虚拟整合文件系统(A Virtual Unified File System)的观点。


周靖人:阿里已远远超出电商平台范畴


640?wx_fmt=png


周靖人表示,阿里已经远远超出电商平台的范畴,广泛涉及支付、广告、娱乐等诸多业务,这些业务都离不开数据分析和数据智能的支持。这些业务背后都有流计算、图计算、机器学习等技术的支持。周靖人还介绍了这些技术在阿里的具体应用,比如淘宝的个性化体验,系统可以根据用户的历史行为,实时地为每个人提供个性化的搜索结果,而且淘宝已经可以做到基于场景的推荐。


王葱权:数字化时代需要大数据应用平台架构


640?wx_fmt=png


面对数字化浪潮,王葱权认为传统的实体经济是根据物理的生产资料来做,其数量是有限的,而数字经济是数字和信息,未来的规模会远远超过实体经济。让企业从独立走向生态是数字化时代的必然结果,未来没有一个企业是独立的。什么样的企业会成为生态?数据即是企业走向生态的基础,但现代企业面临着搞不清究竟有多少核心数据资产,并且面临数据质量不高、业务开发难协作、数据应用无体系等数据问题。


此外他提出,针对面向治理的大数据应用平台架构建设有五大重点:闭环数据应用、端到端服务开发、全链路共享数据服务、安全统一数据网关和服务接口标准化。在数字经济时代,我们需要一个面向治理大数据应用平台,且需围绕“盘-规-整-用”,建立起“采集、开发、管理与服务”一体化平台。


陈性元:存储平台安全是平台安全的重中之重


640?wx_fmt=png


大数据安全目前面临的主要挑战包括防护水平与担负的时代使命不相适应;监管能力与所处的重要地位不相适应,大多利用传统方法,监管不到位;共享程度与应发挥的重要作用不相适应,面对大数据共享,每每陷入不愿、不敢、不能的尴尬境地。要想解决大数据在上述三个方面的安全问题,首先就要有一个技术框架,大数据的技术框架有很多,主要包含两类,一类面向业务流程,一类是面向系统架构。但现有技术框架存在两大问题,一是过于复杂,二是难于操作。


谈及大数据安全技术框架,陈性元重点介绍了大数据的平台安全,同时他指出存储平台的安全是整个平台安全的重中之重。目前关于存储安全主要涉及数据加密,以及数据的完整性证明。和,演讲最后,陈性元还围绕大数据安全技术发分享了一些个人看法。他首先指出根本出路在于用密码技术解决大数据安全;而利用区块链这一新途径也不失为一种有效的方法,但切忌人云亦云,要展开创新研究;用数据世系技术解决问题;用大数据技术解决大数据安全态势感知问题。


朱冰:在虚拟世界实现模拟计算


640?wx_fmt=png


朱冰认为,在现实世界中的任何一个实体,在虚拟世界都有一个对应的虚拟实体, 通过云计算、大数据、AI 等技术,人们能够在虚拟世界实现模拟计算,大大加速现实世界中的技术革新和产业变革,不断成熟的技术与应用让我们还有很多畅想的空间。


王宝晗:中国移动的“大连接” 战略


640?wx_fmt=png


王宝晗称,目前中国移动有 9.16 亿移动端用户,+1.47 亿家庭宽带用户,+300 万基站,带来每天超过 60PB 的网络数据和运营管理数据。数字化时代,基于云、管、端基础设施实现人和物的“普遍连接”成为最重要的特征,中国移动基于此背景在 2016 年确定“大连接” 战略,正式启动了全网统一的大数据平台建设,总体目标是搭平台、聚数据、强管控、建生态。


搭平台是依托资源池建立集中化分布式集群;聚数据把中国移动各省的数据做融合,另外也融合外部行业的优质数据;强管控就是数据不出系统,系统不出移动;建生态是面向社会各界提供开放平台服务,共同建设面向大连接的大数据开放生态。 未来,中国移动将以数据能力开放为核心,通过多租户、安全隔离的方式提供数据资源、基础平台、数据处理和应用开发能力,驱动数据价值挖掘和对外应用合作创新。


郭炜:IOTA 数据架构是新一代计算架构


640?wx_fmt=png


郭炜表示,今天我们依然面对着大数据‘大而不强’、人工智能‘人工’而不‘智能’的现状,随着数据积累越来越多,发现数据湖已经变成了数据的沼泽,需要花费大量的时间清洗出来。同时,CTO/CIO 在大数据方面面临着人才缺失、存储不够、业务分析多变难以满足、各端繁杂不统一、数据量级庞大等挑战。而 IOTA 数据架构就是基于边缘计算的适用于大数据和人工智能新一代的计算架构,郭炜在现场详细讲解了 IOTA 数据架构的特性,比如去 ETL 化架构、非结构化实时结构化为 SQL 数据存储、支持 IOT 设备与现有移动端数据融合、支持边缘 AI 实时反馈等。

     

精彩技术分享继续


随着信息技术的迅猛发展,数据的重要性和价值已毋庸置疑,数据正在改变竞争格局,成为重要的生产要素,更被定义为“21 世纪的新电力”。在信息高速传播的今天,数据已经渗透到每一个行业和业务职能领域,指数级的速度增长将我们带入大数据时代。随着大数据的蓬勃发展,身处潮流旋涡中的开发者们更是亟待窥探大数据技术前沿和行业的整体发展动向。


12 月 7-8 日,大数据大会还有 13 个技术和行业分论坛:大数据分析与生态系统论坛、深度学习论坛、大数据可视分析论坛、推荐系统论坛、大数据安全与政策论坛、精准医疗大数据论坛、数据科学与大数据技术教育论坛、数据库论坛、金融大数据论坛、知识图谱论坛、工业大数据论坛、区块链论坛、交通与旅游大数据论坛。


点击【阅读原文】,查看详细议程,精彩分享不容错过。现场见!


另外,没到现场的小伙伴可以查看下方海报,一览大会第一天的精彩观点分享。(目前大会官网已更新部分PPT,扫描海报二维码即可下载)


640?wx_fmt=jpeg

640?wx_fmt=jpeg

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/dQCFKyQDXYm3F8rB0/article/details/84884335

智能推荐

js sort排序_sort a<b-程序员宅基地

文章浏览阅读103次。/* 排序 >号 从小到大排序 <从大到小排序 */ list.sort(function(a, b) { return a.date < b.date ? 1 : -1; })如果是简单的list就直接 return a < b ? 1 : -1;即可,如果是list里面套的map,可让list按map里面的指定字段进行排揎。..._sort a

前端设置条件限制form表单提交到后端解决方案_jsp前端页面将表单是否提交成功作为限制条件-程序员宅基地

文章浏览阅读375次。<script src="js/jquery-1.8.3.min.js" type="text/javascript"></script> <script type="text/javascript"> function checkName() { var name = document.getElementB..._jsp前端页面将表单是否提交成功作为限制条件

计算机网络sequence number,TCP协议中SequenceNumber和Ack Numbe-程序员宅基地

文章浏览阅读1k次。Sequence Numberlzyws7393074532892018-04-25Number Sequenceqq_391789932452017-09-21理解TCP序列号(Sequence Number)和确认号(Acknowledgment Number)hebbely9822017-01-14Number Sequence(规律)l25336363712902017-07-18Numb..._ack num

计算机系统启动项设置密码,电脑开机第一道密码怎么设置 - 卡饭网-程序员宅基地

文章浏览阅读5.9k次。笔记本电脑怎么进CMOS密码巧设置笔记本电脑怎么进CMOS密码巧设置 笔记本电脑为了保护用户的数据安全,往往采用加密的方式,最常见的还是CMOS密码加密技术。为了让你的重要数据更加安全,你可能需要设置不同的密码,这也就要求你记住许多密码。对于笔记本电脑用户来说,真的需要设置一道道密码关卡吗?非也非也! 一、认识与设置笔记本电脑的CMOS密码 笔记本电脑的CMOS密码大致分为超级密码(Supervi..._电脑第一道密码修改

VulnHub靶机-Jangow: 1.0.1_jangow01-程序员宅基地

文章浏览阅读2.5k次,点赞2次,收藏5次。迟到的文章,就当库存发出来吧~_jangow01

spark实战之RDD的cache或persist操作不会触发transformation计算_spark cache和persist不生效-程序员宅基地

文章浏览阅读1.7w次,点赞2次,收藏5次。默认情况下RDD的transformation是lazy形式,实际计算只有在ation时才会进行,而且rdd的计算结果默认都是临时的,用过即丢弃,每个action都会触发整个DAG的从头开始计算,因此在迭代计算时都会想到用cache或persist进结果进行缓存。敝人看到很多资料或书籍有的说是persist或cache会触发transformation真正执行计算,有的说是不会!敝人亲自实验了一把..._spark cache和persist不生效

随便推点

树莓派GPIO简单操作_树莓派怎么读取gpio口上的信息-程序员宅基地

文章浏览阅读637次。树莓派的GPIO操作被抽象为文件读写,下面以一个例子来说明GPIO操作。_树莓派怎么读取gpio口上的信息

【汽车电子】浅谈车载系统QNX_车机qnx虚拟化软件系统架构-程序员宅基地

文章浏览阅读1.7k次。QNX是一种商用的遵从POSIX规范的类Unix实时操作系统,目标市场主要是面向嵌入式系统。它可能是最成功的微内核操作系统之一。QNX是一种商用的类Unix实时操作系统,遵从POSⅨ规范,目标市场主要是嵌入式系统[1]。QNX成立于1980年,是加拿大一家知名的嵌入式系统开发商。QNX的应用范围极广,包含了:控制保时捷跑车的音乐和媒体功能、核电站和美国陆军无人驾驶Crusher坦克的控制系统[2],还有RIM公司的BlackBerry PlayBook平板电脑。_车机qnx虚拟化软件系统架构

信号发生器设计VHDL代码Quartus仿真_vhdl正弦波信号发生器-程序员宅基地

文章浏览阅读1k次,点赞20次,收藏22次。代码功能:信号发生器设计信号发生器由波形选择开关控制波形的输出,分别能输出正弦波、方汉和三角波三种波形,波形的周期为2秒(由40M有源晶振分频控制)。考虑程序的容量,每种波形在一个周期内均取16个取样点,每个样点数据是8位(数值范围:00000000~1111111)要求将D/A变换前的8位二进数据(以十进制方式)输出到数码管动态演示出来。_vhdl正弦波信号发生器

笔记-Java线程概述_java 线程概述-程序员宅基地

文章浏览阅读629次。Java Concurrency in Practice中对线程安全的定义:当多个线程访问一个类时,如果不用考虑这些线程在运行时环境下的调度和交替运行,并且不需要额外的同步及在调用方代码不必做其他的协调,这个类的行为仍然是正确的,那么这个类就是线程安全的。显然只有资源竞争时才会导致线程不安全,因此无状态对象永远是线程安全的 。过多的同步会产生死锁的问题,死锁属于程序运行的时_java 线程概述

MATLAB从文件读取数据_matlab读取数据-程序员宅基地

文章浏览阅读1.2w次,点赞10次,收藏61次。读取表单Sheet2中部分信息。_matlab读取数据

【实践】基于spark的CF实现及优化_spark cf-程序员宅基地

文章浏览阅读1.4w次。最近项目中用到ItemBased Collaborative Filtering,实践过spark mllib中的ALS,但是因为其中涉及到降维操作,大数据量的计算实在不能恭维。所以自己实践实现基于spark的分布式cf,已经做了部分优化。目测运行效率还不错。以下代码package modelimport org.apache.spark.broadcast.Broadcastimp_spark cf