向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
上海网络辟谣:感染XBB.1.5会大小便失禁?权威机构没说过的症状究竟从何而来******url:https://m.gmw.cn/2023-01/04/content_1303244203.htm,id:1303244203
央视网消息:据“上海网络辟谣”公众号,一则“XBB.1.5攻击心血管和拉肚子”的“朋友圈谣言”被截图后广泛传播,让蒙脱石散一夜脱销。相关传言又出现变种,一则朋友圈群聊信息称上海、北京出现XBB.1.5感染病例“大小便失禁”,呼吁大家囤积纸尿裤。上海辟谣平台收到网友留言,希望能核查一下。
没必要囤积纸尿裤和止泻药
根据上海市疫情防控工作小组通报,目前上海所发现的奥密克戎BQ.1和XBB毒株仅在极少数入境隔离人员中检出,尚未在社会面上造成本土传播。
对于XBB.1.5可能引发的临床症状,中国疾控中心介绍,新冠病毒各个变异株,包括XBB系列变异株,都会感染肠道黏膜细胞,但是否出现肠道临床症状和个体差异有关。对于最近受到关注的XBB.1.5进化分支,并没有证据提示它比其他毒株更容易导致严重的腹泻或胃肠道其他临床表现。
武汉雷神山医院感染三科五病区主任、上海新国际博览中心方舱医院中医专家组组长、上海中医药大学急危重症研究所所长方邦江教授在接受健康时报采访时也表示,“XBB.1.5主要临床症状包括呼吸困难、头痛、喉咙痛、鼻塞、全身疼痛、疲劳和发烧等,与当下我国流行的BF.7等症状几乎一致。”可见,不仅纸尿裤没有必要囤积,蒙脱石散等一些止泻药物也不必盲目囤积。
在国外权威机构的研究调查中,也都没有XBB.1.5会引发严重腹泻的论断。具体可以参看上海辟谣平台发布的《上海监测到XBB毒株,到底该怎么预防?一篇看懂!当心有人借新毒株推销》一文。
对于可能出现的腹泻症状,有很多对症治疗的止泻药物,包括具有化湿止泻作用的中药汤剂和中成药,如藿香正气水、痛泻宁颗粒等。这类药物除了止泻作用外,还具有健脾和胃等作用。方邦江说,临床上一般的“病毒性感冒”等也会导致恶心、呕吐、腹泻等“胃肠型感冒”症状,这是正常的病理反映,不要惊慌,不必杞人忧天。
权威机构没说过的症状从何而来
针对XBB.1.5毒株,圈群热传的“拉肚子”“大小便失禁”等“症状”从何而来?
上海辟谣平台溯源发现,这些“症状”大多来自朋友圈或圈群聊天的推测,且发言者不是权威机构和专业医生,转发者也并非来自权威机构或专业人员。
例如,发朋友圈称“XBB.1.5会攻击心脑血管、引发腹泻而导致蒙脱石散一夜脱销”的当事人接受媒体采访承认,“朋友圈的所有内容都是我自己搜索所得,自己总结,但是主攻心脑血管和拉肚子事后忘记出处,所以我发了第二条朋友圈说明了。”
然而,不论是“忘记出处”还是“没有出处”,该网民传播的都是错误信息,最终因广泛传播而引发误解。
与之类似,近期这条“感染XBB.1.5会大小便失禁”的圈群聊天记录同样经不起推敲:聊天对象不明确,无法判断聊天者的身份;聊天称北京有人感染,却没有患者、地点、是否真的感染了XBB.1.5等具体信息。总之,仅从聊天记录,根本无法判断相关内容是否真实。然而,这条“无头无脑”的消息却再次被转发。
从近期涉疫谣言看,不负责任的言论和不加辨别随意转发,是谣言频发的重要原因。部分网民为了博取关注,编造身份、编造事件,如某网民虚构身份称自己是病毒学博士且在5天内感染了两种不同的毒株;也有部分网民是看热闹“不嫌事大”,故意截取那些不负责任或不可靠的言论传播。
总而言之,目前所有关于“感染XBB.1.5会引发严重腹泻”的言论都来自部分网民揣测或故意编造。加上部分网民不了解情况,一传十十传百,才出现了让人啼笑皆非的“蒙脱石散脱销”“囤积纸尿裤”等现象。上海辟谣平台特别提醒,目前多方均对该话题辟谣,希望公众不要再相信并传播那些无中生有、夸大其词的信息。
朋友圈及圈群聊天不能太随意
互联网并非法外之地,发布及传播不负责任的言论,都可能要承担法律责任。
发朋友圈称“XBB.1.5会攻击心脑血管、引发拉肚子”的当事人接受媒体采访时表示,自己已经在当地派出所做了笔录。但因其只是将相关言论发在朋友圈并没有主动散布到微信群、微博等公众平台,所以民警只是对他进行了批评教育。
“没有主动传播”让该网民免于行政处罚。但是,并非所有的不负责言论都能免于处罚。例如,那名编造“病毒学博士5天内感染两种不同毒株”的网友,就被公安机关依法处以行政拘留。
相关法律明确了在各种社交平台、圈群聊天中发布不实信息需要承担的法律责任。例如,治安管理处罚法第25条提到,散布谣言,谎报险情、疫情、警情或者以其他方法故意扰乱公共秩序的,处5日至10日拘留,并处500元以下罚款;情节较轻的,处5日以下拘留或者500元以下罚款。刑法第291条提到“编造、故意传播虚假信息罪”明确,编造虚假的险情、疫情、灾情、警情,在信息网络或者其他媒体上传播,或者明知是上述虚假信息,故意在信息网络或者其他媒体上传播,严重扰乱社会秩序的,处3年以下有期徒刑、拘役或者管制;造成严重后果的,处3年至7年有期徒刑。
在涉疫谣言中,有不少是个人在圈群聊天或发布在朋友圈等社交空间后被截屏传播的。由此可见,社交平台并不是私密空间,都带有一定的公开性质。何况大部分人在社交平台发布信息时,不会声明禁止外传,这意味着相关信息会被再次传播。与之类似,在圈群聊天,尤其是那些人数众多、聊天者未必互相认识的圈群中,任何一个人的言论都可能被截屏传播到圈群之外,而且在截屏过程中也不排除被断章取义。
可见,在社交平台发表未经证实、个人猜测等言论,都可能造成负面影响。因此,建议网民在社交平台或圈群发言时,不要太随意,更不要发布未经证实、纯属个人揣测的消息,避免引“谣”上身。
(文图:赵筱尘 巫邓炎)