狗狗也有方言,当AI开始翻译动物语言
狗狗也有方言,当AI开始翻译动物语言
狗狗也有方言,当AI开始翻译动物语言界面新闻记者(xīnwénjìzhě) | 丁欣雨
界面新闻编辑 | 姜妍
你想了解(liǎojiě)猫咪发出咕噜咕噜的响声、小狗一直舔人是(shì)什么含义吗?数字技术正在帮助人类实现跨物种交流的可能。
根据本月由国家知识产权局发布的一份专利文件,百度拟定开发一种能破译动物交流方式的系统,利用收集到的声音、动作数据,经人工智能识别(shíbié)出情绪状态结果后,再(zài)映射到语义含义中,翻译成人类(rénlèi)语言(yǔyán)。
而在(zài)国外类似的研究正在如火如荼进行中,在今年世界海豚日(4月14日)前后,谷歌也发布了一款即将(jíjiāng)在夏天(xiàtiān)开源的“DolphinGemma”AI大模型,称其能(chēngqínéng)与海豚实现水下实时交流,并对(duì)它们的后续声音序列(xùliè)进行预测。这种高智商的社会化物种会在从鼻腔喷出空气时发出尾音音节(coda)声来彼此交流,就像人类使用摩斯密码一样。
和海豚同属鲸类的鲸鱼们的语言同样(tóngyàng)在(zài)被研究(yánjiū),近期在《Nature》发表的一项研究,就是利用人工智能梳理了鲸鱼近9000个尾音,发现了其内含的新特征——“弹性伸缩(shēnsuō)(rubato)”和“装饰音(zhuāngshìyīn)(ornamentation)”,鲸鱼会根据对话语境,采用在弹性伸缩、装饰音与稳定节拍间组合变换(biànhuàn)的方式,创造出独特(dútè)尾音。研究人员更因此提出了一种类似于我们国际音标的“抹香鲸音标”。
几十年来,鲸类动物的语言一直是自然声学研究的重中之重,这既(jì)源自对于其他物种的探索冲动,还有更加切实的诉求。1970年,美国生物学家罗杰·佩恩录制了一张全程只有海浪背景下鲸(xiàjīng)鸣声的音乐专辑《座头鲸之歌》,销量超过10万张,并激发“拯救鲸鱼”国际运动的发生,最终阻止了多种(duōzhǒng)海洋(hǎiyáng)哺乳动物(bǔrǔdòngwù)的灭绝。

图源:unsplash
而在当下(dāngxià),“鲸类翻译计划(CETI)”和纽约大学法学院(fǎxuéyuàn)超人类生命项目(MOTH)也试图借鲸类动物声音研究来促进动物新权利的诞生,影响法律裁决。他们(tāmen)发表在《生态法季刊》上的一篇文章(wénzhāng)指出,了解鲸类交流的复杂性和具体内容,能揭示其在船舶交通、石油勘探和深海采矿等人类活动产生的水下噪音中受到的痛苦与(yǔ)折磨。
在反对赋予(fùyǔ)动物权利的论点中,语言(yǔyán)被认作是人类独有的特征。世界各地的土著社群早已意识到动物有自己的交流方式(fāngshì),而(ér)(ér)西方科学界则习惯完全否定动物交流的概念,他们更倾向于注重视觉(shìjué)而非听觉,觉得人类无法观察到的事物就不存在(cúnzài)。而这门科学利于打破这种固定思维,也能更好地与土著群体对于鲸类动物的知识传统相(xiāng)融合。在他们眼中,鲸鱼承载一种古老的神圣精神,把万物凝聚起来,2024年,新西兰、塔希提岛和库克群岛就曾签署一项“海洋宣言”,承认鲸鱼具有法人地位。
与动物交流的创想在国外也落实(luòshí)到了(le)(le)宠物领域(lǐngyù),全球首个人宠翻译器Traini在2024年底于iOS程序推出,这款主要用来理解“狗狗语”的软件由一个华人团队进行开发,依靠(yīkào)其自主研发的PEBI(宠物情绪与行为智能)模型,收集主要来自北美和欧洲区域应用平台上的用户社区信息,目前覆盖了120个不同的狗狗品种,能够检测12种情绪,包括快乐、恐惧等基本情绪和其之外的细微感受。用户只要上传相关的声音、图片和视频(shìpín),就能实现翻译,且官方(guānfāng)数据显示准确率高达至81.5%。反过来,Traini也能把用户的话语例如“看我”“一起走”转换成犬吠(quǎnfèi),传递给(gěi)狗狗。
Traini的(de)CEO孙邻家近期接受一条采访时表示,狗狗拥有的语言表达功能受到其心智程度、社会化进程、品种和生活地区的影响而呈现差别(chābié)。比如“边牧学得更(gèng)快,词汇量就会更大”;而由于(yóuyú)“狗狗也有方言”,这个主要面向英文用户的AI原生应用,听不懂(tīngbùdǒng)中国狗的情况也会出现。“当然还有一种(yīzhǒng)可能,就是狗狗听懂了,但(dàn)是不想做。就像一个小孩子在打游戏,你跟他说去做作业,小孩听懂了,但他就是不想。”

社交媒体截图
就(jiù)如几百年前显微镜的(de)发明拓展了人类视觉所能触达的极限(jíxiàn)那样,人们也在依靠AI开启一个全新的声音世界。用科技记者艾德·永(yǒng)(Ed Yong)的话来说(láishuō),当意识到动物声音也享有一套历史性的、社会性的互动代码,那些人类独有的权利也将有可能扩展到非人类动物上,同时丰富所谓“语言”的包容性定义(dìngyì)、重新审视人与自然的关系。
《听不见的(de)(de)大自然:博物学家的自然聆听笔记》一书的作者、牛津大学环境地理学博士凯伦(kǎilún)·巴克还提醒我们注意,物种间的交流声也能间接反映气候变化的问题,例如非洲大草原上鸟类和其他物种经常在黎明或(huò)黄昏时刻(shíkè)进行合唱,是由于这些时刻空气湿度较高,声音(shēngyīn)也能传播得更远、更快。但随着大气温度和湿度受到影响,它们在更干燥和炎热的环境中更难正常交流。失去相互警告威胁和找到配偶的机会(jīhuì),动物的安全性也会降低,最终影响到它们的繁衍和生存。

[加] 凯伦·巴克 著 邓婧文 译北京科学技术出版社 2024-3
人工智能实现的跨物种交流,“既能用来(yònglái)引发更深层次的亲密感,也可能用来培养一种支配感和操控能力,从而驯化人类以前从未控制过的野生物种。”巴克称,德国的一个研究小组将蜜蜂信号编码(biānmǎ)到一个机器人(jīqìrén)当中,把它送到蜂巢里,机器人能利用蜜蜂的摇摆舞交流,指示蜜蜂停止移动,并飞往特定的花蜜源。研究的下一阶段会将机器人植入蜂巢,让蜜蜂从一开始就(jiù)接纳这些机器人,把它们视作群体的一员。“这样一来,我们将对蜂巢拥有前所未有的控制,而且动物在军事上的使用由来已久,我觉得这会是(shì)一条(yītiáo)值得(zhíde)警惕的路径(lùjìng)。”

界面新闻记者(xīnwénjìzhě) | 丁欣雨
界面新闻编辑 | 姜妍
你想了解(liǎojiě)猫咪发出咕噜咕噜的响声、小狗一直舔人是(shì)什么含义吗?数字技术正在帮助人类实现跨物种交流的可能。
根据本月由国家知识产权局发布的一份专利文件,百度拟定开发一种能破译动物交流方式的系统,利用收集到的声音、动作数据,经人工智能识别(shíbié)出情绪状态结果后,再(zài)映射到语义含义中,翻译成人类(rénlèi)语言(yǔyán)。
而在(zài)国外类似的研究正在如火如荼进行中,在今年世界海豚日(4月14日)前后,谷歌也发布了一款即将(jíjiāng)在夏天(xiàtiān)开源的“DolphinGemma”AI大模型,称其能(chēngqínéng)与海豚实现水下实时交流,并对(duì)它们的后续声音序列(xùliè)进行预测。这种高智商的社会化物种会在从鼻腔喷出空气时发出尾音音节(coda)声来彼此交流,就像人类使用摩斯密码一样。
和海豚同属鲸类的鲸鱼们的语言同样(tóngyàng)在(zài)被研究(yánjiū),近期在《Nature》发表的一项研究,就是利用人工智能梳理了鲸鱼近9000个尾音,发现了其内含的新特征——“弹性伸缩(shēnsuō)(rubato)”和“装饰音(zhuāngshìyīn)(ornamentation)”,鲸鱼会根据对话语境,采用在弹性伸缩、装饰音与稳定节拍间组合变换(biànhuàn)的方式,创造出独特(dútè)尾音。研究人员更因此提出了一种类似于我们国际音标的“抹香鲸音标”。
几十年来,鲸类动物的语言一直是自然声学研究的重中之重,这既(jì)源自对于其他物种的探索冲动,还有更加切实的诉求。1970年,美国生物学家罗杰·佩恩录制了一张全程只有海浪背景下鲸(xiàjīng)鸣声的音乐专辑《座头鲸之歌》,销量超过10万张,并激发“拯救鲸鱼”国际运动的发生,最终阻止了多种(duōzhǒng)海洋(hǎiyáng)哺乳动物(bǔrǔdòngwù)的灭绝。

而在当下(dāngxià),“鲸类翻译计划(CETI)”和纽约大学法学院(fǎxuéyuàn)超人类生命项目(MOTH)也试图借鲸类动物声音研究来促进动物新权利的诞生,影响法律裁决。他们(tāmen)发表在《生态法季刊》上的一篇文章(wénzhāng)指出,了解鲸类交流的复杂性和具体内容,能揭示其在船舶交通、石油勘探和深海采矿等人类活动产生的水下噪音中受到的痛苦与(yǔ)折磨。
在反对赋予(fùyǔ)动物权利的论点中,语言(yǔyán)被认作是人类独有的特征。世界各地的土著社群早已意识到动物有自己的交流方式(fāngshì),而(ér)(ér)西方科学界则习惯完全否定动物交流的概念,他们更倾向于注重视觉(shìjué)而非听觉,觉得人类无法观察到的事物就不存在(cúnzài)。而这门科学利于打破这种固定思维,也能更好地与土著群体对于鲸类动物的知识传统相(xiāng)融合。在他们眼中,鲸鱼承载一种古老的神圣精神,把万物凝聚起来,2024年,新西兰、塔希提岛和库克群岛就曾签署一项“海洋宣言”,承认鲸鱼具有法人地位。
与动物交流的创想在国外也落实(luòshí)到了(le)(le)宠物领域(lǐngyù),全球首个人宠翻译器Traini在2024年底于iOS程序推出,这款主要用来理解“狗狗语”的软件由一个华人团队进行开发,依靠(yīkào)其自主研发的PEBI(宠物情绪与行为智能)模型,收集主要来自北美和欧洲区域应用平台上的用户社区信息,目前覆盖了120个不同的狗狗品种,能够检测12种情绪,包括快乐、恐惧等基本情绪和其之外的细微感受。用户只要上传相关的声音、图片和视频(shìpín),就能实现翻译,且官方(guānfāng)数据显示准确率高达至81.5%。反过来,Traini也能把用户的话语例如“看我”“一起走”转换成犬吠(quǎnfèi),传递给(gěi)狗狗。
Traini的(de)CEO孙邻家近期接受一条采访时表示,狗狗拥有的语言表达功能受到其心智程度、社会化进程、品种和生活地区的影响而呈现差别(chābié)。比如“边牧学得更(gèng)快,词汇量就会更大”;而由于(yóuyú)“狗狗也有方言”,这个主要面向英文用户的AI原生应用,听不懂(tīngbùdǒng)中国狗的情况也会出现。“当然还有一种(yīzhǒng)可能,就是狗狗听懂了,但(dàn)是不想做。就像一个小孩子在打游戏,你跟他说去做作业,小孩听懂了,但他就是不想。”

就(jiù)如几百年前显微镜的(de)发明拓展了人类视觉所能触达的极限(jíxiàn)那样,人们也在依靠AI开启一个全新的声音世界。用科技记者艾德·永(yǒng)(Ed Yong)的话来说(láishuō),当意识到动物声音也享有一套历史性的、社会性的互动代码,那些人类独有的权利也将有可能扩展到非人类动物上,同时丰富所谓“语言”的包容性定义(dìngyì)、重新审视人与自然的关系。
《听不见的(de)(de)大自然:博物学家的自然聆听笔记》一书的作者、牛津大学环境地理学博士凯伦(kǎilún)·巴克还提醒我们注意,物种间的交流声也能间接反映气候变化的问题,例如非洲大草原上鸟类和其他物种经常在黎明或(huò)黄昏时刻(shíkè)进行合唱,是由于这些时刻空气湿度较高,声音(shēngyīn)也能传播得更远、更快。但随着大气温度和湿度受到影响,它们在更干燥和炎热的环境中更难正常交流。失去相互警告威胁和找到配偶的机会(jīhuì),动物的安全性也会降低,最终影响到它们的繁衍和生存。

人工智能实现的跨物种交流,“既能用来(yònglái)引发更深层次的亲密感,也可能用来培养一种支配感和操控能力,从而驯化人类以前从未控制过的野生物种。”巴克称,德国的一个研究小组将蜜蜂信号编码(biānmǎ)到一个机器人(jīqìrén)当中,把它送到蜂巢里,机器人能利用蜜蜂的摇摆舞交流,指示蜜蜂停止移动,并飞往特定的花蜜源。研究的下一阶段会将机器人植入蜂巢,让蜜蜂从一开始就(jiù)接纳这些机器人,把它们视作群体的一员。“这样一来,我们将对蜂巢拥有前所未有的控制,而且动物在军事上的使用由来已久,我觉得这会是(shì)一条(yītiáo)值得(zhíde)警惕的路径(lùjìng)。”

相关推荐
评论列表
暂无评论,快抢沙发吧~
你 发表评论:
欢迎