plp626 发表于 2011-5-19 08:35:15

妙趣找句子

知道我们论坛高人很多,遂发这里先求助下算法。。。
================问题描述=================
集合_01={币,持,愁,丁,封,搁,阁,洁,老,码,企,省,谁,送,锁,态,威}
集合_02={昂,蜂,挂,搂,茂,漂,适,市,堂,异,脂}
集合_03={布,吃,调,范,考,七,弃,球,刃,逃,娃}
集合_04={锄,处,各,弄,茄,射,萄}
集合_05={包,锅,搅,舅,谅,茅,清,帅,椅,阅,者}
集合_06={爆,匆,脆,堆,帆,分,将,昆,理,逆,漆,圆}
集合_07={备,标,崇,唇,娇,切,万,震,指}
集合_08={合,圈,师,谈,锈,愈,月,丈}
集合_09={唉,按,吉,嘉,脉,霉,眉,三,选,有,愉}
集合_10={弊,吊,脊,刊,上,谊,尊}
集合_11={程,栋,锋,看,谋,朋,笋,下,洋}
集合_12={昌,而,萌,砌,舌,同,希}
集合_13={倍,不,服,复,砍,名,萍,稍,舍,耍,伍,植}
集合_14={缎,后,谎,茎,挎,猎,明,税,与,怎}
集合_15={搏,伏,昏,栏,漏,式,氏,踏,透,戏,夏,小,意,脏}
集合_16={餐,成,伐,渐,耐,锐,唐,吐,帐,逐}
集合_17={丑,蔑,民,脑,少,树,挑,我,向,笑,刑,休}
集合_18={倒,递,划,椒,戒,怒,洒,舒}
集合_19={弓,鼓,缓,吓,易,专,蜓}
集合_20={笔,阔,气,且,途,研,演,渔}
集合_21={耕,怕,夕,引}
集合_22={编,脖,怖,化,或,尖,世,帖,挖,外,崖,砖}
集合_23={北,逗,耗,朗,栗,列,吗,渗,洗,众}
集合_24={尘,甘,帘,刘,娘,丘,倘,优,缘,战,蜘}
集合_25={鄙,丙,匙,错,候,伙,则}
集合_26={多,刚,会,脚,戚,尚,甚,通,业,倚,愚}
集合_27={创,丛,笛,君,猛,望}
集合_28={猜,东,怜,谜,蜜,霜,搜,甜,夜,帜}
集合_29={贝,尝,朝,初,帝,缝,萝,逝,思,丝}
集合_30={洞,搞,伞,吞,舞,霞,贞}
集合_31={弟,队,负,感,够,借,鸟,期,生,速,土,伟,星,真,舟}

在这31个集合(集合元素不相交,共包含了304个常用汉字)中,顺序或者逆序地各选“一个字”, 组成一句或者几句基本可以被人理解的话,或几句话(这句话含有且仅含有31个汉字,和若干个“逗号,分号或者等号”)怎么找?我现在有个包含了4万个常用词汇的中文词库(dict.txt,每个词汇都在这304个汉字范围内),如何在可被接受的时间内把这样的话给匹配出来?

提前谢谢各位了,谢谢。。
=================================================

当然,大家也可以抱着娱乐的态度,先找找看,看你最大程度能找到怎样被人理解的话,或者句子,找一半也可以。

xbtianlang 发表于 2011-5-19 09:58:43

没话找话,词不达意,毫无章法可言!

KeyTo9_Fans 发表于 2011-5-19 11:47:26

这些字不是出现频率最高的字,很多字都不是常用字,而且同一个字不能多次出现。所以很难组成普通的句子,可能要考虑古文、诗词、戏剧等形式的句子。

另外,“顺序或者逆序”的规定使得答案的选择面变得很狭窄,不一定可以从中找到令人满意的答案。如果将限制放宽到$31$个集合的任意排列,最佳答案的质量可能会高很多。

plp626 发表于 2011-5-19 13:19:14

我先来一段,
币市布,弄清分标圈,唉,上下同名,后小成,民怒易笔耕化吗,战则刚猛,夜思舞鸟翻译:
币市布 -- 人名,
后小成,意思是说如果这个人后来小有成就
后面的,不好翻译了,,,本来就是硬凑在一起的。。。。

大家可以修改下,或者弄个逆序的。。。
====================
题外话,我这个不是纯粹闹着玩的或者仅仅玩算法,有实用价值的。

zeroieme 发表于 2011-5-20 04:23:59

自然语言处理啊:dizzy:

younger110 发表于 2011-9-30 10:31:28

22。乐观主义者

summer23 发表于 2011-12-1 11:47:11

看不懂。。。

mathematica 发表于 2012-9-3 14:20:51

7# summer23


我也看不懂
页: [1]
查看完整版本: 妙趣找句子