flashman
2007年6月24日以前存档
No Comments

基于姓名频度模式的人名识别

此方法实属弱智,有效方法在此http://www.flashman.com.cn/blog/showlog.asp?cat_id=27&log_id=687
依倨人名库统计每个单字组成姓和名的概率,如”李”姓氏频度5,名字频度1,则”李”...

flashman
2007年6月24日以前存档
No Comments

基于角色标注的中国人名自动识别研究

基于角色标注的中国人名自动识别研究

张华平zhanghp@@software.ict.ac.cn刘群 (Liu Qun)Liuqun@@ ict.ac.cn 中国科学院计算技术研究所软件实验室 北京 100080
摘要:中国人名的识别是中文未...

flashman
2007年6月24日以前存档
No Comments

给分词代码中加入了英文/外文/数字/引号支持

说起来给英文分词应该是最简单的,因为英文的空格就是分词界,不过实现的时候发现由于和中文混在一起,倒使得对英文分词有些麻烦了,机械式的查找/验证是否字母然后再组合成词似乎...

flashman
2007年6月24日以前存档
No Comments

最大优先级分词法

前段日子好不容易想到些思路正准备实现,不想却被一堆繁杂琐事所干扰,好不容易处理的差不多,今天终于一鼓作气实现了这种基础分词方式,基本思路是首先扫描出文本中包含的所有词组...

flashman
2007年6月24日以前存档
No Comments

下载的《风月》结尾部分断断续续,本来就看着累人,还不让我知道结局,郁闷!

看的有些受不了,一群疯子,不过让我佩服的是,这么难揣摩的戏,荣哥居然都能演的那么投入,仿佛电影里的郁忠良就是他本人一样,演戏好的真是没话说,唉~~只可惜看破凡尘太早了点,...

flashman
2007年6月24日以前存档
No Comments

(转载)美军的士兵守则

美军的士兵守则:(或者你看到这个就知道为什么中美朝对抗牺牲人数为什么差距这么大了吧)
1.You are not a superman. 你不是超人。(不要无谓的冒险、不要做傻事)
 2. If it’s...

flashman
2007年6月24日以前存档
No Comments

有点累,下回再看,先收着.

本地通信系统的 IP 安全性 Joanie Rhine Microsoft 解决方案框架 企业安全的最佳方案
注意 本白皮书是系列白皮书之一。“企业安全的最佳方案” 包含本系列文章的完整列表。另请参见 Security...

flashman
2007年6月24日以前存档
No Comments

野战归来!

耶~~~蛮爽的,总共打掉5个人,还算不错的说,嗯,有点累了,刚洗完澡,想睡觉~~~来张ncuhome”战队”合影先~~~

大部队
[Edit on 2005-4-18 13:47:17 By flashman]

...
flashman
2007年6月24日以前存档
No Comments

职场健康:远离电脑病完全手册(转载,我得好好参考参考)

  OFFICE里,电脑是我们最重要的一件办公用品,很难想像,如果没有了电脑,我们将如何工作。但遗憾的是,当我们享受着电脑带给我们的一切方便的同时,也不得不接受它在身心两方面...

flashman
2007年6月24日以前存档
No Comments

照自己的理解的最大匹配分词法试了试

最大匹配法实现容易,不过却问题多多,主要是对岐义和重叠词处理的不好,要能加上词组优先级处理可能会好些,还有人名识别的问题,困难多多.难道非得去研究语法语义不可吗?我哪耗的起啊.

Pages: 1 2 3