recs_searcher.augmentation package

Submodules

recs_searcher.augmentation._actions module

recs_searcher.augmentation._base module

class recs_searcher.augmentation._base.BaseAugmentation(min_aug: int = 1, max_aug: int = 5, seed: int = None)[исходный код]

Базовые классы: BaseTransformation

__augs_count(size: int, rate: float) int

Подсчитывает количество аугментаций и выполняет обрезание по максимальному или минимальному числу.

Параметры

size: int

Количество символов или слов в тексте.

rate: float

Процент символов или слов, к которым будет применено увеличение.

Returns

int: количество аугментаций.

__get_random_idx(inputs: List[str], aug_count: int) List[int]

Рандомно выбирает индексы для аугментации.

Параметры

inputs: List[str]

Список символов или слов.

aug_count: int

Количество аугментаций.

Returns:

List[int]: список индексов.

_abc_impl = <_abc._abc_data object>
_aug_indexing(inputs: List[str], rate: float, clip: bool = False) List[int][исходный код]
Args:
inputs: List[str]

Список символов или слов.

rate: float

Процент символов или слов, к которым будет применено увеличение.

clip: bool

Учитывает максимальное и минимальное значения. По умолчанию False.

Returns:

List[int]: List of indices.

abstract _transform(array: List[str]) List[str][исходный код]

Преобразование, применяемое к каждому текстовому элементу списка array.

Параметры

arrayList[str]

Список с текстом, который нужно преобразовать. Например, [„Hello! My nam3 is Harry :)“, „Понятно, а я Рон.“].

Returns

array: List[str]

Список с применёнными преобразованиями текста.

recs_searcher.augmentation._char_aug module

class recs_searcher.augmentation._char_aug.CharAugmentation(unit_prob: float = 0.3, min_aug: int = 1, max_aug: int = 5, mult_num: int = 5, action: Literal['delete', 'multiply', 'swap', 'insert'] | None = None, seed: int | None = None)[исходный код]

Базовые классы: BaseAugmentation

Augmentation at the character level.

__delete() str

Deletes a random character.

Returns:

str: Empty string.

__insert(char: str, vocab: List[str]) str

Inserts a random character.

Args:

char (str): A symbol from the word. vocab (List[str]): …

Returns:

str: A symbol + new symbol.

__multiply(char: str) str

Repeats a randomly selected character.

Args:

char (str): A symbol from the word.

Returns:

str: A symbol from the word matmul n times.

_abc_impl = <_abc._abc_data object>
_transform(array: List[str]) List[str][исходный код]

Преобразование, применяемое к каждому текстовому элементу списка array.

Параметры

arrayList[str]

Список с текстом, который нужно преобразовать. Например, [„Hello! My nam3 is Harry :)“, „Понятно, а я Рон.“].

Returns

array: List[str]

Список с применёнными преобразованиями текста.

property actions_list: List[str]

Returns:

List[str]: A list of possible methods.

recs_searcher.augmentation._word_aug module

class recs_searcher.augmentation._word_aug.WordAugmentation(unit_prob: float = 0.3, min_aug: int = 1, max_aug: int = 5, action: Literal['delete', 'swap', 'split'] | None = None, seed: int = None)[исходный код]

Базовые классы: BaseAugmentation

Augmentation at the level of words.

__delete() str

Deletes a random word.

Returns:

str: Empty string.

__split(word: str) str

Divides a word character-by-character.

Args:

word (str): A word with the correct spelling.

Returns:

str: Word with spaces.

_abc_impl = <_abc._abc_data object>
_transform(array: List[str]) List[str][исходный код]

Преобразование, применяемое к каждому текстовому элементу списка array.

Параметры

arrayList[str]

Список с текстом, который нужно преобразовать. Например, [„Hello! My nam3 is Harry :)“, „Понятно, а я Рон.“].

Returns

array: List[str]

Список с применёнными преобразованиями текста.

property actions_list: List[str]
Returns:

List[str]: A list of possible methods.

Module contents