Spaces:

RMakushkin
/

test_2_2

Sleeping

App Files Files Community

test_2_2 / pages /02_🔥_Results.py

RMakushkin

Rename pages/02_🔥_Results (2).py to pages/02_🔥_Results.py

3ae5caa 8 months ago

raw

history blame contribute delete

No virus

1.64 kB

	import streamlit as st
	from PIL import Image, ImageOps
	import matplotlib.pyplot as plt

	st.write("""
	## 📝 Итоги проекта Рекомендательные системы.
	""")
	"""
	###### 1. Парсинг профильных сайтов, итоговый с kino.mail.ru.
	"""

	st.image('images/mem.jpg', width=400)

	"""
	###### 2. Сбор и анализ информации с киносервисов. Формирование датасета. Итоговый размер - 14939 объектов.
	"""
	col1, col2 = st.columns(2)

	with col1:
	st.image('images/1.jpeg')

	with col2:
	st.image('images/2.jpeg')
	# st.image('images/1.png')

	"""
	###### 3. Предобработка данных от лишных символов и пропусков.
	"""
	st.image('images/3.jpeg')
	st.image('images/4.jpeg')

	"""
	###### 4. Векторизация с использованием очередной модели RuBERT
	"""
	st.write("По классике использовался rubert-base-cased-sentence от DeepPavlov")
	st.write("Предобученная на русском датасете модель для классификации текстов")
	st.write("Показала себя лучше, чем узкопрофильные модели от sentence_tran, т.к. они мультиязычные и имеют меньший словарный запас")
	st.write("rubert_tiny_2 также показал себя не с лучшей стороны")
	st.write("По процессу все стандартно, токенизация, пэдинг, обрезание...вектор")