సహకార ఫిల్టరింగ్ని ఉపయోగించి పైథాన్లోని చలనచిత్ర సిఫార్సు సిస్టమ్ యొక్క ఉదాహరణ ఇక్కడ ఉంది:
కొండచిలువimport pandas as pd
import numpy as np
# Load data
ratings_data = pd.read_csv('ratings.csv')
movies_data = pd.read_csv('movies.csv')
# Merge data
movie_ratings_data = pd.merge(ratings_data, movies_data, on='movieId')
# Calculate mean rating for each movie
movie_ratings_mean = movie_ratings_data.groupby('title')['rating'].mean().reset_index()
# Create pivot table of ratings data
movie_ratings_pivot = movie_ratings_data.pivot_table(index='userId', columns='title', values='rating')
# Fill missing values with 0
movie_ratings_pivot.fillna(0, inplace=True)
# Calculate similarity matrix
movie_similarity_matrix = np.corrcoef(movie_ratings_pivot.T)
# Get movie index
movie_index = np.where(movie_ratings_pivot.columns == 'Toy Story (1995)')[0][0]
# Get similar movies
similar_movies = list(movie_ratings_pivot.columns[(movie_similarity_matrix[movie_index] > 0.5) & (movie_similarity_matrix[movie_index] < 1)])
print(f"Similar movies to Toy Story (1995): {', '.join(similar_movies)}")
pandas
మూవీ రేటింగ్లు మరియు మూవీ డేటాను ఒకే డేటాఫ్రేమ్లో లోడ్ చేయడానికి మరియు విలీనం చేయడానికి ఈ కోడ్ లైబ్రరీని ఉపయోగిస్తుంది . ప్రతి సినిమాకు సగటు రేటింగ్ అప్పుడు లెక్కించబడుతుంది మరియు సినిమా రేటింగ్ల డేటాను నిల్వ చేయడానికి పివోట్ టేబుల్ సృష్టించబడుతుంది. పివోట్ పట్టిక 0 తప్పిపోయిన విలువలతో నిండి ఉంది మరియు లైబ్రరీని ఉపయోగించి సారూప్యత మాతృక లెక్కించబడుతుంది numpy
. కోడ్ తర్వాత చలనచిత్రాన్ని ఎంచుకుంటుంది (ఈ సందర్భంలో, 'టాయ్ స్టోరీ (1995)'), పివోట్ పట్టికలో దాని సూచికను కనుగొంటుంది మరియు 0.5 సారూప్యత థ్రెషోల్డ్ ఆధారంగా సారూప్య చలన చిత్రాల జాబితాను పొందుతుంది.
యాప్ను ఉపయోగించడానికి, CSV ఫార్మాట్లో మీ స్వంత సినిమా రేటింగ్లు మరియు మూవీ డేటాను అందించండి మరియు తదనుగుణంగా కోడ్ను సవరించండి. సిఫార్సులను మార్చడానికి చలనచిత్ర సూచిక మరియు సారూప్యత థ్రెషోల్డ్ని కూడా సర్దుబాటు చేయవచ్చు....