recs_searcher.explain package
Submodules
recs_searcher.explain._base module
Алгоритмы для объяснение сходства одного текста на другой.
- class recs_searcher.explain._base.DistanceExplain(model: BaseEmbedding, preprocessing: List[BaseTransformation] = [], distance: Literal['cosine', 'euclidean'] | Callable[[ndarray, ndarray], float] = 'cosine')[исходный код]
Базовые классы:
BaseExplainКласс для интерпретации сходства двух текстовых данных путём взятия окна из n-токенов из оригинального текста и подсчёта расстояния их эмбеддингов с оригинальным.
- __define_distance(distance: Literal['cosine', 'euclidean'] | Callable[[ndarray, ndarray], float]) Callable[[ndarray, ndarray], float]
Определение функции для подсчёта расстояния между 2 векторами.
Параметры
- distanceUnion[Literal[„cosine“, „euclidean“], Callable[[np.ndarray, np.ndarray], float]]
Текст - для получения функции, реализованной в данном проекта. Функция - для встраивания своей функции для подсчёта расстояния.
Returns
- distance: Callable[[np.ndarray, np.ndarray], float]
Функция для подсчёта расстояния между двумя векторами.
- _abc_impl = <_abc._abc_data object>
- _explain(clear_compared_text: str, clear_original_text: str, n_grams: int | None = 1, analyzer: Literal['word', 'char'] = 'word', sep: str | None = ' ') Tuple[List[str], List[float], List[Tuple[int, int]]][исходный код]
Поиск наиболее схожих N-грамм из clear_compared_text в clear_original_text.
Параметры
- clear_compared_textstr
Пользовательский текст, в котором нужно найти n-граммы, похожие на clear_original_text.
- clear_original_textstr
Текст, с которым сравнивается clear_compared_text.
- n_gramsint
Длина N-грамм.
- analyzer: Literal[„word“, „char“]
Считать схожесть текстов на основе N-грамм слов или символов.
- sep: Optional[str]
Разделитель слов.
Returns
- text_list: List[str]
Список N-грамм слов или символов.
- similarity_list: List[float]
Список близости N-граммы к clear_original_text.
- indeces_n_grams_list: List[Tuple[int, int]]
Список кортежей индексов старта и конца N-граммы из text_list.