敏感词过滤
使用php扩展trie_filter,利用词库,过滤敏感词
功能
关键词过滤扩展,用于检查一段文本中是否出现敏感词,基于Double-Array Trie 树实现。
安装步骤 下面的$LIB_PATH为依赖库安装目录,$INSTALL_PHP_PATH为PHP5安装目录。
安装libdatrie依赖库
下载地址:http://linux.thai.net/~thep/datrie/datrie.html#Download $ tar zxvf libdatrie-0.2.4.tar.gz $ cd libdatrie-0.2.4 $ make clean $ ./configure --prefix=$LIB_PATH $ make $ makeinstall
安装trie_filter扩展 (https://github.com/wulijun/php-ext-trie-filter)
$ $INSTALL_PHP_PATH/bin/phpize $ ./configure --with-php-config=$INSTALL_PHP_PATH/bin/php-config --with-trie_filter=$LIB_PATH $ make $ makeinstall 然后修改php.ini,增加一行:extension=trie_filter.so,然后重启PHP。
PHP测试实例
测试效果,输出格式(顺序值=>该敏感词出现的位置-该敏感词的长度-敏感词)
注意事项
dict.txt 为敏感词库,一个词一行 PHP需要5.2以上版本
Last updated