recs_searcher.explain package

Submodules

recs_searcher.explain._base module

Алгоритмы для объяснение сходства одного текста на другой.

class recs_searcher.explain._base.DistanceExplain(model: BaseEmbedding, preprocessing: List[BaseTransformation] = [], distance: Literal['cosine', 'euclidean'] | Callable[[ndarray, ndarray], float] = 'cosine')[исходный код]

Базовые классы: BaseExplain

Класс для интерпретации сходства двух текстовых данных путём взятия окна из n-токенов из оригинального текста и подсчёта расстояния их эмбеддингов с оригинальным.

__define_distance(distance: Literal['cosine', 'euclidean'] | Callable[[ndarray, ndarray], float]) Callable[[ndarray, ndarray], float]

Определение функции для подсчёта расстояния между 2 векторами.

Параметры

distanceUnion[Literal[„cosine“, „euclidean“], Callable[[np.ndarray, np.ndarray], float]]

Текст - для получения функции, реализованной в данном проекта. Функция - для встраивания своей функции для подсчёта расстояния.

Returns

distance: Callable[[np.ndarray, np.ndarray], float]

Функция для подсчёта расстояния между двумя векторами.

_abc_impl = <_abc._abc_data object>
_explain(clear_compared_text: str, clear_original_text: str, n_grams: int | None = 1, analyzer: Literal['word', 'char'] = 'word', sep: str | None = ' ') Tuple[List[str], List[float], List[Tuple[int, int]]][исходный код]

Поиск наиболее схожих N-грамм из clear_compared_text в clear_original_text.

Параметры

clear_compared_textstr

Пользовательский текст, в котором нужно найти n-граммы, похожие на clear_original_text.

clear_original_textstr

Текст, с которым сравнивается clear_compared_text.

n_gramsint

Длина N-грамм.

analyzer: Literal[„word“, „char“]

Считать схожесть текстов на основе N-грамм слов или символов.

sep: Optional[str]

Разделитель слов.

Returns

text_list: List[str]

Список N-грамм слов или символов.

similarity_list: List[float]

Список близости N-граммы к clear_original_text.

indeces_n_grams_list: List[Tuple[int, int]]

Список кортежей индексов старта и конца N-граммы из text_list.

Module contents