ding兄,你上次是不是公开了一个分词系统让试用的啊,我当时测了一下,似乎都能识别人名,想请教是怎么做到的啊?
另,现在为什么找不到你的那个系统连接页面了?
主要还是根据概率来的。
几种情况:
1。在中文里边,很多字和词不可能作姓名,如“死”啊这些。
2。有的一定是作姓名的,如“笪”。
3。字与字(词)之间的转移概率很大--作为姓名。
...
基本原理就是这么简单。
唉,都一两年了,都快全忘记了。
williamkin wrote:hi,再请教一下,你的词库是自己建立的,还是下载来的呢?
谢谢
其实词库和主要算法基础都来自北大詹卫东老师的中文信息基础课的相关内容:
http://ccl.pku.edu.cn/doubtfire/Course/Chinese%20Information%20Processing/2002_2003_1.htm
不过后来好像对算法和词库作了一些改动,但是基本的还是从里边来的。