彩神- - (中国)百度热搜
彩神2022-05-15

向善而生的AI助盲 ,让AI多一点,障碍少一点******

  有人说,盲人与世界之间 ,相差的只是一个黎明。在浪潮信息研发人员 的心中,失去视力 的盲人不会陷入永夜 ,科技 的进步正在力图给每一个人以光明未来。

  AI助盲在人工智能赛道上一直 是最热门的话题之一 。以前,让失明者重见光明依靠的是医学 的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表 的多模态智能技术的爆发式突破,更多 的失明者正在借助AI提供的感知、理解与交互能力 ,以另一种方式重新“看见世界” 。

  新契机 :多模态算法或将造福数以亿计失明者

  科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境 的视觉感知与视觉理解能力,无疑 是最直接有效的解决方案。

  一个优秀 的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现 的系统化发展 ,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够 ,以“机器视觉+自然语言理解”为代表 的多模态算法 的突破才 是正确的新方向和新契机 。

  多个模态 的交互可以提升AI 的感知 、理解与交互能力 ,也为AI理解并帮助残障人士带来了更多可能 。浪潮信息研发人员介绍说 ,多模态算法在AI助盲领域的应用一旦成熟 ,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明 ,而我国 是世界上盲人最多 的国家,占世界盲人总数 的18%-20% ,每年新增的盲人数量甚至高达45万 。

  大挑战 :如何看到盲人“眼中” 的千人千面

  AI助盲看似简单 ,但多模态算法依然面临重大挑战。

  多模态智能算法,营造 的 是沉浸式人机交互体验。在该领域 ,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄 的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。

  但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里 的肉类 、咨询药品的服用说明 、挑选独特颜色 的衬衣 、介绍书籍内容等等 。

  另一方面 ,由于盲人的特殊性 ,很难提取面前物体 的有效特征。比如盲人在拍照时 ,经常会产生虚焦 的情况 ,可能上传的照片是模糊 的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。

  为推动相关研究,来自卡内基梅隆大学等机构 的学者们共同构建了一个盲人视觉数据库“VizWiz” ,并发起全球多模态视觉问答挑战赛 。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应 的答案 ,解决盲人的求助 。

  另外,盲人 的视觉问答还会遭遇到噪声干扰 的衍生问题 。比如说 ,盲人逛超市,由于商品外观触感相似 ,很容易犯错 ,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息 。

  最后 ,针对不同盲人患者的个性化交互服务以及算法自有 的反馈闭环机制 ,同样也 是现阶段 的研发难点 。

  多解法 :浪潮信息AI助盲靶向消灭痛点

  AI助盲哪怕形式百变 ,无一例外都 是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域 的AI助盲研究 ,只为帮助盲人“看”到愈发精彩 的世界。

  在VizWiz官网上公布的2万份求助中,盲人最多的提问就 是想知道他们面前的是什么东西 ,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名 是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型 ,通过自动修正图像角度及字符语义增强 ,结合光学字符检测识别技术解决“是什么” 的问题。

  盲人所拍摄图片模糊、有效信息少 ?研发团队提出了答案驱动视觉定位与大模型图文匹配结合 的算法 ,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像 、残缺的信息,依然能够精准 的解答用户 的求助 。

  目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点 ,在AI助盲领域斩获世界冠军两项 、亚军两项 。

  真实场景中 的盲人在口述时往往会有口误 、歧义、修辞等噪声。为此 ,研发团队首次提出视觉定位文本去噪推理任务FREC ,FREC提供3万图片和超过25万的文本标注,囊括了口误 、歧义、主观偏差等多种噪声 ,还提供噪声纠错 、含噪证据等可解释标签 。同时 ,该团队还构建了首个可解释去噪视觉定位模型FCTR ,噪声文本描述条件下精度较传统模型提升11个百分点 。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。

  在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE 。该研究成果已发表于ACM Multimedia 2022会议 。该研究项目 的底层技术未来可广泛应用于AI医疗诊断、故事续写 、剧情推理 、危情告警、智能政务等多模态交互推理场景 。

  眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲 、AI反诈 、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍 ,跨越山海 。科技的伟大之处不仅仅在于改变世界,更重要的 是如何造福人类 ,让更多的不可能变成可能 。当科技成为人 的延伸,当AI充满人性光辉 ,我们终将在瞬息万变 的科技浪潮中感受到更加细腻温柔 的善意,见证着更加光明宏大的远方。

彩神

数字经济推动中国式现代化的逻辑与路径******

  作者:李卫东(北京交通大学经济管理学院教授) ;陈镜宇(北京交通大学经济管理学院博士研究生)

  党的二十大报告提出 ,“从现在起 ,中国共产党 的中心任务就是团结带领全国各族人民全面建成社会主义现代化强国 、实现第二个百年奋斗目标,以中国式现代化全面推进中华民族伟大复兴。”中国式现代化 是人口规模巨大 的现代化 , 是全体人民共同富裕的现代化, 是物质文明和精神文明相协调 的现代化 ,是人与自然和谐共生 的现代化 , 是走和平发展道路的现代化。高质量发展 是中国式现代化的本质要求之一 。数字经济 是高质量发展的新引擎,正以前所未有 的速度、范围和影响 ,推动着生产方式 、生活方式 、治理方式发生深刻变革 ,不断促进公平和效率更加统一 。因此 ,成功推进和拓展中国现代化,必须紧紧抓住数字经济发展机遇 ,必须坚持数字化创新引领发展,不断做强做优做大数字经济。新时代新征程背景下,更要深刻把握数字经济助力中国式现代化的理论逻辑和作用路径,全力推进“五个现代化” 的有机统一 。

  以数据资源新禀赋重铸人口规模新红利

  人口规模巨大的现代化 是立足于中国基本国情提出的最能体现中国特色的现代化。在改革开放 的40多年里 ,中国吸引了大量 的外资投入 ,推动制造业快速发展 ,带动国民经济 的繁荣增长。但随着发展的变化,这些人口红利正逐渐改变 。新时期 ,中国庞大 的人口规模如何重焕生机?数据新要素的出现为此提供了可能。数据要素具有边际报酬递增特性 ,体现为数据量越大 ,场景越丰富,数据使用价值就越高 。而数据主要来源于人类活动 。因此 ,占有全球18%人口的中国无疑具有世界其他国家不可比拟 的数据资源优势,人口迎来了数字时代的新红利。数字经济助力人口规模巨大的现代化主要路径在于改善人口结构和提高人口素质 。

  在人口结构方面 ,数字技术 的虚拟 、开放 、共享等特征有助于打破城乡之间的时空壁垒、信息壁垒、市场壁垒,促进要素资源在城乡之间更为自由地流动,为城镇化进程营造更好的环境条件。此外,数字经济为城市经济 的发展创造了新 的增长点 ,其巨大 的创造效应催生了更多城市就业岗位,例如外卖员、滴滴司机 、物流配送人员等 ,增加农村居民 的转移意愿和就业供给。在人口素质方面 ,无论是数字核心产业本身,还 是数字技术创新驱动传统产业转型升级,都对劳动力技能水平有更高 的要求,其产生的“优胜劣汰”效应将倒逼全社会人力资本水平整体提升。城镇化水平的提高和人口素质 的提高都 是中国迈向现代化 的一个重要标志 。

  以数字技术新优势增加共同富裕新机遇

  全体人民共同富裕的现代化是扎根于社会主义本质提出 的最能反映社会主义国家特色的现代化 。共同富裕 的重要一点是致富机会要相对均等 。数字经济能够助力共同富裕 的逻辑基点在于数字技术本质上是一种普惠性技术 ,这与社会主义本质紧密相关。数字经济依托其“互联互通、共建共享”的技术特征,在经济社会活动中形成了广泛 的正外部性,有助于改善传统工业经济下低收入群体难以获得技术支持 的劣势地位,增加低收入群体的致富机会。

  于后富群体而言 ,首先,致富机会不均等往往受教育程度影响,后者则导致了个人知识学习和能力提升的机会不均等 。数字技术与教育相结合衍生 的新型教育资源和远程授课等新型教育方式,大幅改善了知识获取 的公平性 ,促进了“教育致富” 。自2010年以来,哈佛大学 、耶鲁大学以及国内外高校已经陆续提供线上免费公开课程。其次,基于大数据和区块链技术 的数字普惠金融构建了以信用取缔抵押的新金融体系,有效缓解了投融资双方 的信息不对称,增加了广大中低收入群体和中小企业 的获得借贷资金 的机会 ,推动了“大众创新、万众创业”,促进了“创业致富”。再者,在数字经济背景下,各类社交网络平台空前发达 ,促进了“才华致富” 。于先富群体而言 ,数字技术还有利于强化经济活动的时空关联性、产业关联性和主体关联性 ,能增强先富群体对后富群体 的带动作用 。对政府部门而言 ,数字技术应用于政府治理 ,有利于全方位地提高政府服务和监管 的精细化和智能化,增强政府决策的合理性和科学性 ,健全完善政府在共同富裕中的体制保障作用。

  以数字经济新形态提升中华文明新高度

  物质文明与精神文明相协调的现代化 是着力于解决中国主要矛盾的最能体现新时代中国特色社会主义 的现代化。物质富足和精神富有 是中国式现代化的根本要求 。数字经济凭借其高效性和创新性的双重特征 ,能够推进物质文明和精神文明协同发展 。物质文明方面 ,数据作为一种新 的生产要素,其蕴含 的信息价值优化了传统生产要素的组合方式 ,进一步释放了劳动生产力,提高了全要素生产率 ,加快了物质产出和物质财富的创造速度。就GDP增速而言 ,2021年中国数字经济规模达到45.5万亿元,同比名义增长16.2% ,高于同期GDP名义增速3.4个百分点 。精神文明方面 ,数字经济则有助于推动文化繁荣和基本公共服务改善。在文化领域 ,数字技术为系统化地记录 、保存、继承广大民间文学和民间文艺提供了可能 ,同时也为中华文化 的传播 、普及、弘扬提供了更有力 的方式 。基于数字孪生 、VR 、AR等技术的数字文旅产业以其资源无限和时空无界 的新特性 ,不仅解决了传统文旅的供需不均衡问题 ,更是带来了全新的沉浸式旅客体验,刺激了更多人对中国文化的认知兴趣 ,满足了人们对文化高质量发展的精神需求。在社会服务领域 ,以各类公共服务平台为主 的数字基础设施建设和应用进一步提高了教育 、医疗、卫生、交通等公共资源的供需匹配效率 ,促进了基本公共服务均等化、精准化和智能化 ,提高了民生保障水平和居民幸福度 。在物质文明与精神文明匹配上 ,数字经济所具有的长尾效应特性使得广大消费者 的个性化 、差异化、多元化需求在最大化程度上得以满足 ,延展了人们的精神生活空间 ,提高了人们生活内容的多样性 。

  以数字命运共同体共创人类发展新道路

  人与自然和谐共生 的现代化与走和平发展道路 的现代化 是基于新时代背景的最能体现全人类发展诉求 的两个现代化 。环境保护及和平发展 是全球现代化的共同特征。数字经济的先天优势更有利于打造绿色经济和共享经济。一方面,数字技术应用于能源生产和环境监测,能显著提高能源利用效率和环境监测效率 ,加强碳排放和环境污染的协同治理 ,从治理路径上缓解环境问题。更重要的是 ,5G 、物联网 、工业互联网等核心技术应用于新能源技术研发与应用,能大幅压缩研发成本和市场化进程 ,助力能源结构加速变革,从治理根源上解决环境问题 。另一方面,数字经济背景下,国际贸易模式正在重塑,全球经济一体化趋势不断加强 。数字技术通过简化交易流程和透明交易信息 ,大幅减少了国际贸易的交易周期和交易成本,推进跨境数字服务贸易 的蓬勃发展,深化了各国在经济领域的分工和合作。更为深刻和长远的影响在于 ,以互联网为核心 的数字经济的不断发展促进了世界各国和世界各国人民 的距离日益缩短、关系日益亲近 、文化日益交融,有助于增进交流与合作 、减少对立和冲突 ,推动构建网络空间命运共同体和人类命运共同体 ,共创互利共赢 的和平发展道路 。

中国网客户端

国家重点新闻网站,9语种权威发布

彩神地图