最近非常纠结的一个问题:我所用的机器的操作系统是64位Windows 7,使用Python 3对微博文本进行处理,现在面对的一个大问题就是如何使用分词工具NLPIR和Stanford大学的开源句法分析Java包Stanford Parser进行文本处理。 经过我的搜索,大概有三方面的思路:
但很明显,我不知道具体应该怎么做?希望有大牛来给个指引!谢谢!
可以用Python的扩展来实现。可参考Extending Python with C or C++。
Python本来是C实现的,封装二进制兼容的C++是很容易的。
Java的话得通过JNI来实现,就是说在Python扩展里用C调用Java。
另外,你也可以写一个TCP服务来包装C++/Java的接口,通过网络来调用,这样更通用。
欢迎来到随意问技术百科, 这是一个面向专业开发者的IT问答网站,提供途径助开发者查找IT技术方案,解决程序bug和网站运维难题等。 温馨提示:本网站禁止用户发布与IT技术无关的、粗浅的、毫无意义的或者违法国家法规的等不合理内容,谢谢支持。