recs_searcher.dataset package

Subpackages

Submodules

recs_searcher.dataset._base module

Обёртки датасетов для различных моделей.

class recs_searcher.dataset._base.SentenceTransformerDataset(array: Iterable[str], augmentation_transform: List[BaseTransformation] | None = None)[исходный код]

Базовые классы: Dataset

Обёртка дадасета для эмбеддингов из Sentence-Transformers.

recs_searcher.dataset._dataframes module

Загрузка датасета в формате pandas.DataFrame

recs_searcher.dataset._dataframes._load_csv_data(filename: str, encoding='utf-8') DataFrame[исходный код]

Загрузка csv-файла.

Параметры

filenamestr

Путь до csv-файл. Все csv-файлы лежат в /recs/recs/datasets/data Например, „city_Russia.csv“.

Returns

df: pd.DataFrame

Считанный csv-файл.

recs_searcher.dataset._dataframes.load_address_krasnoyarsk() DataFrame[исходный код]

Загрузка датасета с адресами Красноярска. Датасет содержит только уникальные значения.

Кол-во строк

72885

Кол-во столбцов

1

Returns

df: pd.DataFrame

Считанные данные.

recs_searcher.dataset._dataframes.load_city_russia() DataFrame[исходный код]

Загрузка датасета с городами России. Датасет содержит только уникальные значения.

Кол-во строк

1082

Кол-во столбцов

1

Returns

df: pd.DataFrame

Считанные данные.

recs_searcher.dataset._dataframes.load_company_russia() DataFrame[исходный код]

Загрузка датасета с названиями ООО из России. Датасет содержит только уникальные значения.

Кол-во строк

5245

Кол-во столбцов

1

Returns

df: pd.DataFrame

Считанные данные.

recs_searcher.dataset._dataframes.load_exoplanes() DataFrame[исходный код]

Загрузка датасета с названиями планет. Датасет содержит только уникальные значения.

Кол-во строк

5506

Кол-во столбцов

1

Returns

df: pd.DataFrame

Считанные данные.

recs_searcher.dataset._dataframes.load_medical_supplies() DataFrame[исходный код]

Загрузка датасета с названиями медицинских препаратов. Датасет содержит только уникальные значения.

Кол-во строк

1210

Кол-во столбцов

1

Returns

df: pd.DataFrame

Считанные данные.

recs_searcher.dataset._dataframes.load_mobile_phones() DataFrame[исходный код]

Загрузка датасета с названиями смартфонов. Датасет содержит только уникальные значения.

Кол-во строк

223

Кол-во столбцов

1

Returns

df: pd.DataFrame

Считанные данные.

recs_searcher.dataset._dataframes.load_russian_dictionary() DataFrame[исходный код]

Словарь русских слов.

Кол-во строк

52129

Кол-во столбцов

1

Returns

df: pd.DataFrame

Считанные данные.

recs_searcher.dataset._dataframes.load_video_games() DataFrame[исходный код]

Загрузка датасета с названиями видео-игр. Датасет содержит только уникальные значения.

Кол-во строк

11562

Кол-во столбцов

1

Returns

df: pd.DataFrame

Считанные данные.

Module contents