如何用英文字母随机生成一个可读的英文单词?

因为经常接触汉化工作的原因,我突发灵想,想要做一个程序用来随机生成中文的音译词,

像是“克里斯蒂娜”“克罗地亚”“芙兰蒂亚”这样的地名或人名的音译词。

我在维基上找到新华出版社的一张国际音标到汉字的音译对译表。

剩下工作就是设计一个生成英文单词的算法,以及将字母转换成音标的算法。

生成单词的算法要求生成的单词是否有词义都可以,但单词必须是元音辅音结合的,符合可以朗读的单词。比如说“pialote”这样。

我查到了关于英文文本中各个字母的大致频率以及首字母的频率,但是还是没有找到关于单词的构成规则。

这似乎属于语言学的什么分支学科,有谁对语言学比较了解的,能够为我提供帮助,关于构词

推荐  (0) | 4人关注关注
2个答案
19 0

这个并不需要语言学,统计学就行了

https://www.wolfram.com/language/gallery/generate-random-pronounceable-words/

大体思路就是统计词库中2个确定字母后紧跟的字母的频率,比如-fr-后面跟的字母按照频率是

然后就按以频率为概率递归生成就好了,算法细节可以参考上面的链接,比如以AA表示词首,Z表示词尾,就不需要人为干预随机生成的初始和结束。下图就是构成随机词汇"frickle"的过程(我强制让前两个字母是fr,所以第一次转移概率是100%,实际不一定如此)

如有需要我再细写

0 0

滚键盘,如果没有元音就重来,比如SUDHA

查看更多

添加回答

登录 后回答问题,你也可以用以下帐号直接登录

相关问答

关于我们 加入果壳 媒体报道 帮助中心 果壳活动 家长监控 免责声明 联系我们 移动版 移动应用

©果壳网    京ICP证100430号    京网文[2018] 6282-492号    新出发京零字第朝200003号     京公网安备11010502007133号

违法和不良信息举报邮箱:jubao@guokr.com    举报电话:18612934101    网上有害信息举报专区    儿童色情信息举报专区