recs_searcher.dataset package
Subpackages
Submodules
recs_searcher.dataset._base module
Обёртки датасетов для различных моделей.
- class recs_searcher.dataset._base.SentenceTransformerDataset(array: Iterable[str], augmentation_transform: List[BaseTransformation] | None = None)[исходный код]
Базовые классы:
DatasetОбёртка дадасета для эмбеддингов из Sentence-Transformers.
recs_searcher.dataset._dataframes module
Загрузка датасета в формате pandas.DataFrame
- recs_searcher.dataset._dataframes._load_csv_data(filename: str, encoding='utf-8') DataFrame[исходный код]
Загрузка csv-файла.
Параметры
- filenamestr
Путь до csv-файл. Все csv-файлы лежат в /recs/recs/datasets/data Например, „city_Russia.csv“.
Returns
- df: pd.DataFrame
Считанный csv-файл.
- recs_searcher.dataset._dataframes.load_address_krasnoyarsk() DataFrame[исходный код]
Загрузка датасета с адресами Красноярска. Датасет содержит только уникальные значения.
Кол-во строк
72885
Кол-во столбцов
1
Returns
- df: pd.DataFrame
Считанные данные.
- recs_searcher.dataset._dataframes.load_city_russia() DataFrame[исходный код]
Загрузка датасета с городами России. Датасет содержит только уникальные значения.
Кол-во строк
1082
Кол-во столбцов
1
Returns
- df: pd.DataFrame
Считанные данные.
- recs_searcher.dataset._dataframes.load_company_russia() DataFrame[исходный код]
Загрузка датасета с названиями ООО из России. Датасет содержит только уникальные значения.
Кол-во строк
5245
Кол-во столбцов
1
Returns
- df: pd.DataFrame
Считанные данные.
- recs_searcher.dataset._dataframes.load_exoplanes() DataFrame[исходный код]
Загрузка датасета с названиями планет. Датасет содержит только уникальные значения.
Кол-во строк
5506
Кол-во столбцов
1
Returns
- df: pd.DataFrame
Считанные данные.
- recs_searcher.dataset._dataframes.load_medical_supplies() DataFrame[исходный код]
Загрузка датасета с названиями медицинских препаратов. Датасет содержит только уникальные значения.
Кол-во строк
1210
Кол-во столбцов
1
Returns
- df: pd.DataFrame
Считанные данные.
- recs_searcher.dataset._dataframes.load_mobile_phones() DataFrame[исходный код]
Загрузка датасета с названиями смартфонов. Датасет содержит только уникальные значения.
Кол-во строк
223
Кол-во столбцов
1
Returns
- df: pd.DataFrame
Считанные данные.
- recs_searcher.dataset._dataframes.load_russian_dictionary() DataFrame[исходный код]
Словарь русских слов.
Кол-во строк
52129
Кол-во столбцов
1
Returns
- df: pd.DataFrame
Считанные данные.
- recs_searcher.dataset._dataframes.load_video_games() DataFrame[исходный код]
Загрузка датасета с названиями видео-игр. Датасет содержит только уникальные значения.
Кол-во строк
11562
Кол-во столбцов
1
Returns
- df: pd.DataFrame
Считанные данные.