Print Search
帖子排序:    
帖子发起人: 谁与争疯   发起时间: 2006-06-06 09:37 上午   回复: 5
williamkin 离线,最后访问时间: 2007-1-31 16:55:48 谁与争疯

发帖数前25位
注册: 2005-10-17
发 贴: 32
DCDing,请进
 2006-06-06, 09:37 上午

ding兄,你上次是不是公开了一个分词系统让试用的啊,我当时测了一下,似乎都能识别人名,想请教是怎么做到的啊?

另,现在为什么找不到你的那个系统连接页面了?

IP 地址: 已记录   报告
dcding 离线,最后访问时间: 2006-11-7 13:48:14 dcding

发帖数前10位
注册: 2005-07-23
发 贴: 279
Re: DCDing,请进
 2006-06-06, 10:23 上午

主要还是根据概率来的。

几种情况:

1。在中文里边,很多字和词不可能作姓名,如“死”啊这些。

2。有的一定是作姓名的,如“笪”。

3。字与字(词)之间的转移概率很大--作为姓名。

...

基本原理就是这么简单。

唉,都一两年了,都快全忘记了。

 

IP 地址: 已记录   报告
williamkin 离线,最后访问时间: 2007-1-31 16:55:48 谁与争疯

发帖数前25位
注册: 2005-10-17
发 贴: 32
Re: DCDing,请进
 2006-06-06, 17:49 下午
我看了些相关资料,觉得你实现的系统很了不起。非常佩服!
IP 地址: 已记录   报告
williamkin 离线,最后访问时间: 2007-1-31 16:55:48 谁与争疯

发帖数前25位
注册: 2005-10-17
发 贴: 32
Re: DCDing,请进
 2006-06-06, 17:51 下午
hi,再请教一下,你的词库是自己建立的,还是下载来的呢?
IP 地址: 已记录   报告
dcding 离线,最后访问时间: 2006-11-7 13:48:14 dcding

发帖数前10位
注册: 2005-07-23
发 贴: 279
Re: DCDing,请进
 2006-06-06, 23:28 下午

 williamkin wrote:
hi,再请教一下,你的词库是自己建立的,还是下载来的呢?

谢谢

其实词库和主要算法基础都来自北大詹卫东老师的中文信息基础课的相关内容:

http://ccl.pku.edu.cn/doubtfire/Course/Chinese%20Information%20Processing/2002_2003_1.htm

不过后来好像对算法和词库作了一些改动,但是基本的还是从里边来的。

 

IP 地址: 已记录   报告
williamkin 离线,最后访问时间: 2007-1-31 16:55:48 谁与争疯

发帖数前25位
注册: 2005-10-17
发 贴: 32
Re: DCDing,请进
 2006-06-07, 11:31 上午
站在巨人的肩膀上的啊:)
谢谢你给的资源。
IP 地址: 已记录   报告
合肥微软技术中心社区 » 技术讨论区 » .NET技术相关 » Re: DCDing,请进

Powered by Community Server Powered by CnForums.Net