recs_searcher.augmentation package
Submodules
recs_searcher.augmentation._actions module
recs_searcher.augmentation._base module
- class recs_searcher.augmentation._base.BaseAugmentation(min_aug: int = 1, max_aug: int = 5, seed: int = None)[исходный код]
Базовые классы:
BaseTransformation- __augs_count(size: int, rate: float) int
Подсчитывает количество аугментаций и выполняет обрезание по максимальному или минимальному числу.
Параметры
- size: int
Количество символов или слов в тексте.
- rate: float
Процент символов или слов, к которым будет применено увеличение.
Returns
int: количество аугментаций.
- __get_random_idx(inputs: List[str], aug_count: int) List[int]
Рандомно выбирает индексы для аугментации.
Параметры
- inputs: List[str]
Список символов или слов.
- aug_count: int
Количество аугментаций.
Returns:
List[int]: список индексов.
- _abc_impl = <_abc._abc_data object>
- _aug_indexing(inputs: List[str], rate: float, clip: bool = False) List[int][исходный код]
- Args:
- inputs: List[str]
Список символов или слов.
- rate: float
Процент символов или слов, к которым будет применено увеличение.
- clip: bool
Учитывает максимальное и минимальное значения. По умолчанию False.
- Returns:
List[int]: List of indices.
- abstract _transform(array: List[str]) List[str][исходный код]
Преобразование, применяемое к каждому текстовому элементу списка array.
Параметры
- arrayList[str]
Список с текстом, который нужно преобразовать. Например, [„Hello! My nam3 is Harry :)“, „Понятно, а я Рон.“].
Returns
- array: List[str]
Список с применёнными преобразованиями текста.
recs_searcher.augmentation._char_aug module
- class recs_searcher.augmentation._char_aug.CharAugmentation(unit_prob: float = 0.3, min_aug: int = 1, max_aug: int = 5, mult_num: int = 5, action: Literal['delete', 'multiply', 'swap', 'insert'] | None = None, seed: int | None = None)[исходный код]
Базовые классы:
BaseAugmentationAugmentation at the character level.
- __delete() str
Deletes a random character.
- Returns:
str: Empty string.
- __insert(char: str, vocab: List[str]) str
Inserts a random character.
- Args:
char (str): A symbol from the word. vocab (List[str]): …
- Returns:
str: A symbol + new symbol.
- __multiply(char: str) str
Repeats a randomly selected character.
- Args:
char (str): A symbol from the word.
- Returns:
str: A symbol from the word matmul n times.
- _abc_impl = <_abc._abc_data object>
- _transform(array: List[str]) List[str][исходный код]
Преобразование, применяемое к каждому текстовому элементу списка array.
Параметры
- arrayList[str]
Список с текстом, который нужно преобразовать. Например, [„Hello! My nam3 is Harry :)“, „Понятно, а я Рон.“].
Returns
- array: List[str]
Список с применёнными преобразованиями текста.
recs_searcher.augmentation._word_aug module
- class recs_searcher.augmentation._word_aug.WordAugmentation(unit_prob: float = 0.3, min_aug: int = 1, max_aug: int = 5, action: Literal['delete', 'swap', 'split'] | None = None, seed: int = None)[исходный код]
Базовые классы:
BaseAugmentationAugmentation at the level of words.
- __delete() str
Deletes a random word.
- Returns:
str: Empty string.
- __split(word: str) str
Divides a word character-by-character.
- Args:
word (str): A word with the correct spelling.
- Returns:
str: Word with spaces.
- _abc_impl = <_abc._abc_data object>
- _transform(array: List[str]) List[str][исходный код]
Преобразование, применяемое к каждому текстовому элементу списка array.
Параметры
- arrayList[str]
Список с текстом, который нужно преобразовать. Например, [„Hello! My nam3 is Harry :)“, „Понятно, а я Рон.“].
Returns
- array: List[str]
Список с применёнными преобразованиями текста.
- property actions_list: List[str]
- Returns:
List[str]: A list of possible methods.