鼠标点击任意字符会立即双字符实体标注。 点击插入键(或按“u”)在光标前插入指定的字符,字符的标签默认为“O”,如有必要,重新标注实体。 如果需要在页面最后位置处插入字符,需要间接操作才能实现(因为这种情况比较少见,故不再优化)。 LAnn2Triple.py文件用于将标注过的.lann文件转换为三元组数据集,将自动读取当前result文件夹下所有的.lann文件,并按照75%的训练集和25%的测试集进行切分,同时输出数据集的统计信息。 数据集的格式同NYT,但所有Tokens为字符,且无POS特征。 lann LAnn2NER.py文件用于将标注过的.lann文件转换为NER数据集,将自动读取当前result文件夹下所有的.lann文件,并按照75%的训练集和25%的测试集进行切分,同时输出数据集的统计信息。
- 如果需要在页面最后位置处插入字符,需要间接操作才能实现(因为这种情况比较少见,故不再优化)。
- LAnn2Triple.py文件用于将标注过的.lann文件转换为三元组数据集,将自动读取当前result文件夹下所有的.lann文件,并按照75%的训练集和25%的测试集进行切分,同时输出数据集的统计信息。
- 鼠标点击任意字符会立即双字符实体标注。
- LAnn2NER.py文件用于将标注过的.lann文件转换为NER数据集,将自动读取当前result文件夹下所有的.lann文件,并按照75%的训练集和25%的测试集进行切分,同时输出数据集的统计信息。
- 目前为封闭域关系三元组标注,不提供新关系的标注,之前开放域关系三元组版本将不再维护,不再维护,不再维护,存在BUG!
语料文本的标注结果文件(.lann)每行为一个字符,包含三列,每列用”\t“隔开,分别对应字符域、实体关系域和三元组域。 lann 目前为封闭域关系三元组标注,不提供新关系的标注,之前开放域关系三元组版本将不再维护,不再维护,不再维护,存在BUG! lann 计划脱离对Django框架的依赖,借助PyQt的WebEngine实现标注界面和Python程序数据传输,更好地支持Pytorch和数据处理,已基本打通JS和Python之间的墙壁。
lann: LAnn标注工具
由香港SEO公司 featured.com.hk 提供SEO服務
- 数据集的格式同NYT,但所有Tokens为字符,且无POS特征。
- 语料文本的标注结果文件(.lann)每行为一个字符,包含三列,每列用”\t“隔开,分别对应字符域、实体关系域和三元组域。
- 如果需要在页面最后位置处插入字符,需要间接操作才能实现(因为这种情况比较少见,故不再优化)。
- 计划脱离对Django框架的依赖,借助PyQt的WebEngine实现标注界面和Python程序数据传输,更好地支持Pytorch和数据处理,已基本打通JS和Python之间的墙壁。
- 鼠标点击任意字符会立即双字符实体标注。
- LAnn2NER.py文件用于将标注过的.lann文件转换为NER数据集,将自动读取当前result文件夹下所有的.lann文件,并按照75%的训练集和25%的测试集进行切分,同时输出数据集的统计信息。
- 目前为封闭域关系三元组标注,不提供新关系的标注,之前开放域关系三元组版本将不再维护,不再维护,不再维护,存在BUG!