From 6f2f25434ec10323c6e5ecb226559ea4573caeb1 Mon Sep 17 00:00:00 2001 From: Chris Lee Date: Fri, 7 Aug 2015 11:42:23 -0400 Subject: [PATCH] ADD: Multilingual keyword tests --- tests/test_remote.py | 34 ++++++++++++++++++++++++++++++++++ 1 file changed, 34 insertions(+) diff --git a/tests/test_remote.py b/tests/test_remote.py index 228b70f..93b6388 100644 --- a/tests/test_remote.py +++ b/tests/test_remote.py @@ -1,3 +1,5 @@ +#!/usr/bin/python +# -*- coding: utf-8 -*- import unittest import os, random from PIL import Image @@ -250,6 +252,38 @@ class FullAPIRun(unittest.TestCase): for v in results.values(): assert v >= .1 + def test_keywords_language(self): + text = "La semaine suivante, il remporte sa premiere victoire, dans la descente de Val Gardena en Italie, près de cinq ans après la dernière victoire en Coupe du monde d'un Français dans cette discipline, avec le succès de Nicolas Burtin à Kvitfjell." + words = set(text.lower().split()) + + results = keywords(text, language = 'detect') + sorted_results = sorted(results.keys(), key=lambda x:results.get(x), reverse=True) + + self.assertTrue(set(results.keys()).issubset(words)) + + results = keywords(text, top_n=3) + assert len(results) is 3 + + results = keywords(text, threshold=.1) + for v in results.values(): + assert v >= .1 + + def test_keywords_language(self): + text = "La semaine suivante, il remporte sa premiere victoire, dans la descente de Val Gardena en Italie, près de cinq ans après la dernière victoire en Coupe du monde d'un Français dans cette discipline, avec le succès de Nicolas Burtin à Kvitfjell." + words = set(text.lower().split()) + + results = keywords(text, language = 'French') + sorted_results = sorted(results.keys(), key=lambda x:results.get(x), reverse=True) + + self.assertTrue(set(results.keys()).issubset(words)) + + results = keywords(text, top_n=3) + assert len(results) is 3 + + results = keywords(text, threshold=.1) + for v in results.values(): + assert v >= .1 + def test_named_entities(self): text = "London Underground's boss Mike Brown warned that the strike ..." expected_entities = ("London Underground", "Mike Brown")