mirror of
https://github.com/wassname/IndicoIo-python.git
synced 2026-06-27 16:10:34 +08:00
Merge pull request #112 from IndicoDataSolutions/Chris/add-multilingual
ADD: Multilingual keyword tests
This commit is contained in:
@@ -1,3 +1,5 @@
|
||||
#!/usr/bin/python
|
||||
# -*- coding: utf-8 -*-
|
||||
import unittest
|
||||
import os, random
|
||||
from PIL import Image
|
||||
@@ -250,6 +252,38 @@ class FullAPIRun(unittest.TestCase):
|
||||
for v in results.values():
|
||||
assert v >= .1
|
||||
|
||||
def test_keywords_language(self):
|
||||
text = "La semaine suivante, il remporte sa premiere victoire, dans la descente de Val Gardena en Italie, près de cinq ans après la dernière victoire en Coupe du monde d'un Français dans cette discipline, avec le succès de Nicolas Burtin à Kvitfjell."
|
||||
words = set(text.lower().split())
|
||||
|
||||
results = keywords(text, language = 'detect')
|
||||
sorted_results = sorted(results.keys(), key=lambda x:results.get(x), reverse=True)
|
||||
|
||||
self.assertTrue(set(results.keys()).issubset(words))
|
||||
|
||||
results = keywords(text, top_n=3)
|
||||
assert len(results) is 3
|
||||
|
||||
results = keywords(text, threshold=.1)
|
||||
for v in results.values():
|
||||
assert v >= .1
|
||||
|
||||
def test_keywords_language(self):
|
||||
text = "La semaine suivante, il remporte sa premiere victoire, dans la descente de Val Gardena en Italie, près de cinq ans après la dernière victoire en Coupe du monde d'un Français dans cette discipline, avec le succès de Nicolas Burtin à Kvitfjell."
|
||||
words = set(text.lower().split())
|
||||
|
||||
results = keywords(text, language = 'French')
|
||||
sorted_results = sorted(results.keys(), key=lambda x:results.get(x), reverse=True)
|
||||
|
||||
self.assertTrue(set(results.keys()).issubset(words))
|
||||
|
||||
results = keywords(text, top_n=3)
|
||||
assert len(results) is 3
|
||||
|
||||
results = keywords(text, threshold=.1)
|
||||
for v in results.values():
|
||||
assert v >= .1
|
||||
|
||||
def test_named_entities(self):
|
||||
text = "London Underground's boss Mike Brown warned that the strike ..."
|
||||
expected_entities = ("London Underground", "Mike Brown")
|
||||
|
||||
Reference in New Issue
Block a user