赛博仓颉,在线造字!Stable Diffusion:没人比我更懂汉字

  新智元报道

  编辑:昕朋

  被中文折磨的歪果仁,开始用 Stable Diffusion 学习汉字!更绝的是,SD 不仅精通汉字,还能当场造字。皮卡丘、iPhone、深度学习统统被拿捏!

  学习外语,不是件容易事。

  当然,这份苦,不只有中国人吃。

  在 Reddit 上,有一个「r/ChineseLanguage」的话题,里头专门发一些外国人学中文遇到的问题的吐槽。

  对大部分学习中文的外国人来说,汉字永远是个跨不过去的坎。

  没有正确的学习方法,学习者很难记住成百上千个结构各异的汉字。

  不过没关系,Stable Diffusion 会出手。

  字不认识?看「图」!

  在 Reddit 的 Stable Diffusion 频道,网友分享了文字生成模型 Depth2Image。

  代码链接:https://huggingface.co/stabilityai/stable-diffusion-2-depth/blob/main/512-depth-ema.ckpt

  该模型使用 Stable Diffusion 的技术,可以将汉字图像转变为它所代表的含义。

  例如,用火腿组成的「肉」字,

  以及用绳子组成的「绳」字。

  博主分享了图像的生成方式,在模型中输入需要呈现的材质照片,Depth2Image 就会生成该材质对应的中文汉字。

  此贴一出便引来广泛讨论。网友在热情分享自己创作的文字同时,也激动地表示:这在教育领域的应用未来可期!

  其实在两年前,已经有人从事文字图像化的研究。推特网友@azlenelza 就利用助神经网络,通过生成视觉助记符的方式将汉字图形化,表示各自的含义。

  Azlen 表示,这种方式会让各个汉字的意义和形状之间建立更多的联系,从而使每个汉字更容易记住。

  可以发现,当时 AI 生成的图像更属于艺术字的范畴。例如右下角的图像,小编看了好久才认出是「制」字。

  经过两年的发展,文字图像化的技术更加成熟。有了这项技术,或许真的能帮助汉语学习者更好地掌握每个汉字,在汉语教学领域大放异彩。

  字不够用?得「造」!

  更绝的是,Stable Diffusion 还能造字。

  在学习了 1 万个日文汉字后,Stable Diffusion 模型开始为新事物创造「假汉字」,如马里奥、皮卡丘、马斯克、深度学习、YouTube、高达、奇点等。

  在这些字中,我们也发现了华点。

  Stable Diffusion 创造的「马里奥」和本尊相比,不能说毫不相干,只能说是一模一样(好家伙,纯象形字是吧)。

  另外,AI 模型造的「马斯克」一字也够霸气。称王还不够,直接超级加倍,变「王中王」。

  相比之下,卷福和尼古拉斯·凯奇哭晕在厕所。

  如果扩大输出图像的尺寸,模型还会整花活,生成一个比二维码还要复杂的「文字」。

  密恐人士:6。

  评论区有人说:「这不是西夏文吗?」

  别说,还真有点像。这 AI,知识学杂了。

  在中日网友的眼中,这类技术可能只是为了整活。毕竟看惯了本国文字,就算看对方语言的汉字也会感到奇怪。

  但对于身处另一套语言系统的人来说,看到一个个结构各异的图像,竟有如此丰富的内涵,或许更能感受到语言和文字的魅力。

  巴别塔后,人类文字不通,无法交流;现代科技在克服语言壁垒的同时,又在建造一座新的「巴别塔」。这次,人类会成功吗?

  参考资料:

https://twitter.com/hardmaru/status/1614119727416369152?s=46&t=BdjSSthlkb8_b_AWoh4BGw

https://www.reddit.com/r/StableDiffusion/comments/10b3r24/using_depth2image_to_create_images_to_aid/