import streamlit as st import pandas as pd import torch from transformers import AutoTokenizer, AutoModel import faiss import numpy as np @st.cache_data def load_data(url): df = pd.read_csv(url) # 👈 Download the data return df df = load_data('data/final_data.csv') st.title('Умный поиск фильмов 🔍🎦') st.header('Выполнила команда "FindMyMovie":') st.subheader('🎥Алексей') st.subheader('🎬Светлана') st.subheader('🍿Тата') st.subheader('Наши задачи:') st.markdown(""" Задача 1: Спарсить информацию по 5 тыс. фильмов и обработать ее Задача 2: Разработать систему поиска фильма по пользовательскому запросу """, unsafe_allow_html=True) st.markdown( f"
Мы любезно позаимствовали данные о фильмах с \ Киноафиши, ни один участник команды при этом не пострадал 💟
", unsafe_allow_html=True ) st.subheader(' '*10) st.info('🌟Сервис принимает на вход описание фильма от пользователя и возвращает заданное количество подходящих вариантов') st.info('🌟Если не знаете, что посмотреть, нажмите кнопку "Сгенерировать" - сервис предложит вам 10 случайных фильмов из библиотеки') # Отображаем HTML-разметку в Streamlit if st.button("Сгенерировать 🎲"): # Получение случайных 10 строк, включая 'image_url' и 'actors' random_rows = df[['movie_title', 'description', 'actors', 'image_url', 'page_url']].sample(n=10).reset_index(drop=True) random_rows.index = random_rows.index + 1 st.markdown(f"{'Сегодня мы подобрали для вас следующие фильмы:'}", unsafe_allow_html=True) for i in range(5): st.markdown(f"{random_rows['movie_title'].iloc[i]}", unsafe_allow_html=True) col1, col2 = st.columns([2, 1]) col1.info(random_rows['description'].iloc[i]) col1.markdown(f"**В ролях:** {random_rows['actors'].iloc[i]}") col1.markdown(f"**Фильм можно посмотреть [здесь]({random_rows['page_url'].iloc[i]})**") col2.image(random_rows['image_url'].iloc[i], caption=random_rows['movie_title'].iloc[i], width=200)