import pandas as pd
import numpy as np
from sklearn.model_selection import *
from sklearn.metrics import accuracy_score,confusion_matrix,ConfusionMatrixDisplay
from sklearn.linear_model import LogisticRegression
from sklearn.preprocessing import StandardScaler
import matplotlib.pyplot as plt
regular_season_totals = pd.read_csv("regular_season_totals.csv")
play_off_totals = pd.read_csv("play_off_totals.csv")

np.random.seed(100)

regular_season_main_predictors_training,regular_season_main_predictors_testing,regular_season_main_WL_training,regular_season_main_WL_testing = train_test_split(regular_season_totals[["fieldGoalsMade","threePointersMade","freeThrowsMade","reboundsTotal","assists","blocks"]],
                                                                                 regular_season_totals["WL"],test_size=0.2)

standard_scaler = StandardScaler()
regular_season_main_predictors_training = standard_scaler.fit_transform(regular_season_main_predictors_training)
regular_season_main_predictors_testing = standard_scaler.transform(regular_season_main_predictors_testing)

regular_season_main_classification_model = LogisticRegression()

regular_season_main_classification_model.fit(regular_season_main_predictors_training,regular_season_main_WL_training)

regular_season_main_classification_model_predictions = regular_season_main_classification_model.predict(regular_season_main_predictors_testing)

regular_season_main_classification_model_accuracy = accuracy_score(regular_season_main_WL_testing,regular_season_main_classification_model_predictions)

regular_season_main_classification_model_confusion_matrix = confusion_matrix(regular_season_main_WL_testing,regular_season_main_classification_model_predictions)

regular_season_main_classification_model_accuracy

0.7225390156062425

regular_season_main_classification_model_confusion_matrix_display = ConfusionMatrixDisplay(confusion_matrix=regular_season_main_classification_model_confusion_matrix,display_labels=regular_season_main_classification_model.classes_)
regular_season_main_classification_model_confusion_matrix_display.plot()
plt.show()

np.random.seed(100)

play_offs_main_predictors_training,play_offs_main_predictors_testing,play_offs_main_WL_training,play_offs_main_WL_testing = train_test_split(play_off_totals[["fieldGoalsMade","threePointersMade","freeThrowsMade","reboundsTotal","assists","blocks"]],
                                                                                 play_off_totals["WL"],test_size=0.2)

standard_scaler = StandardScaler()
play_offs_main_predictors_training = standard_scaler.fit_transform(play_offs_main_predictors_training)
play_offs_main_predictors_testing = standard_scaler.transform(play_offs_main_predictors_testing)

play_offs_main_classification_model = LogisticRegression()

play_offs_main_classification_model.fit(play_offs_main_predictors_training,play_offs_main_WL_training)

play_offs_main_classification_model_predictions = play_offs_main_classification_model.predict(play_offs_main_predictors_testing)

play_offs_main_classification_model_accuracy = accuracy_score(play_offs_main_WL_testing,play_offs_main_classification_model_predictions)

play_offs_main_classification_model_confusion_matrix = confusion_matrix(play_offs_main_WL_testing,play_offs_main_classification_model_predictions)

play_offs_main_classification_model_accuracy

0.718816067653277

play_offs_main_classification_model_confusion_matrix_display = ConfusionMatrixDisplay(confusion_matrix=play_offs_main_classification_model_confusion_matrix,display_labels=play_offs_main_classification_model.classes_)
play_offs_main_classification_model_confusion_matrix_display.plot()
plt.show()

np.random.seed(100)

regular_season_bottom_predictors_training,regular_season_bottom_predictors_testing,regular_season_bottom_WL_training,regular_season_bottom_WL_testing = train_test_split(regular_season_totals[["steals","foulsPersonal","turnovers","fieldGoalsAttempted","threePointersAttempted","freeThrowsAttempted"]],
                                                                                 regular_season_totals["WL"],test_size=0.2)

standard_scaler = StandardScaler()
regular_season_bottom_predictors_training = standard_scaler.fit_transform(regular_season_bottom_predictors_training)
regular_season_bottom_predictors_testing = standard_scaler.transform(regular_season_bottom_predictors_testing)

regular_season_bottom_classification_model = LogisticRegression()

regular_season_bottom_classification_model.fit(regular_season_bottom_predictors_training,regular_season_bottom_WL_training)

regular_season_bottom_classification_model_predictions = regular_season_bottom_classification_model.predict(regular_season_bottom_predictors_testing)

regular_season_bottom_classification_model_accuracy = accuracy_score(regular_season_bottom_WL_testing,regular_season_bottom_classification_model_predictions)

regular_season_bottom_classification_model_confusion_matrix = confusion_matrix(regular_season_bottom_WL_testing,regular_season_bottom_classification_model_predictions)

regular_season_bottom_classification_model_accuracy

0.5975390156062425

regular_season_bottom_classification_model_confusion_matrix_display = ConfusionMatrixDisplay(confusion_matrix=regular_season_bottom_classification_model_confusion_matrix,display_labels=regular_season_bottom_classification_model.classes_)
regular_season_bottom_classification_model_confusion_matrix_display.plot()
plt.show()

np.random.seed(100)

play_offs_bottom_predictors_training,play_offs_bottom_predictors_testing,play_offs_bottom_WL_training,play_offs_bottom_WL_testing = train_test_split(play_off_totals[["steals","foulsPersonal","turnovers","fieldGoalsAttempted","threePointersAttempted","freeThrowsAttempted"]],
                                                                                 play_off_totals["WL"],test_size=0.2)

standard_scaler = StandardScaler()
play_offs_bottom_predictors_training = standard_scaler.fit_transform(play_offs_bottom_predictors_training)
play_offs_bottom_predictors_testing = standard_scaler.transform(play_offs_bottom_predictors_testing)

play_offs_bottom_classification_model = LogisticRegression()

play_offs_bottom_classification_model.fit(play_offs_bottom_predictors_training,play_offs_bottom_WL_training)

play_offs_bottom_classification_model_predictions = play_offs_bottom_classification_model.predict(play_offs_bottom_predictors_testing)

play_offs_bottom_classification_model_accuracy = accuracy_score(play_offs_bottom_WL_testing,play_offs_bottom_classification_model_predictions)

play_offs_bottom_classification_model_confusion_matrix = confusion_matrix(play_offs_bottom_WL_testing,play_offs_bottom_classification_model_predictions)

play_offs_bottom_classification_model_accuracy

0.5813953488372093

play_offs_bottom_classification_model_confusion_matrix_display = ConfusionMatrixDisplay(confusion_matrix=play_offs_bottom_classification_model_confusion_matrix,display_labels=play_offs_bottom_classification_model.classes_)
play_offs_bottom_classification_model_confusion_matrix_display.plot()
plt.show()

np.random.seed(100)

regular_season_all_predictors_training,regular_season_all_predictors_testing,regular_season_all_WL_training,regular_season_all_WL_testing = train_test_split(regular_season_totals[["fieldGoalsMade","threePointersMade","freeThrowsMade","reboundsTotal","assists","blocks","steals","foulsPersonal","turnovers","fieldGoalsAttempted","threePointersAttempted","freeThrowsAttempted"]],
                                                                                 regular_season_totals["WL"],test_size=0.2)

standard_scaler = StandardScaler()
regular_season_all_predictors_training = standard_scaler.fit_transform(regular_season_all_predictors_training)
regular_season_all_predictors_testing = standard_scaler.transform(regular_season_all_predictors_testing)

regular_season_all_classification_model = LogisticRegression()

regular_season_all_classification_model.fit(regular_season_all_predictors_training,regular_season_all_WL_training)

regular_season_all_classification_model_predictions = regular_season_all_classification_model.predict(regular_season_all_predictors_testing)

regular_season_all_classification_model_accuracy = accuracy_score(regular_season_all_WL_testing,regular_season_all_classification_model_predictions)

regular_season_all_classification_model_confusion_matrix = confusion_matrix(regular_season_all_WL_testing,regular_season_all_classification_model_predictions)

regular_season_all_classification_model_accuracy

0.8463385354141657

regular_season_all_classification_model_confusion_matrix_display = ConfusionMatrixDisplay(confusion_matrix=regular_season_all_classification_model_confusion_matrix,display_labels=regular_season_all_classification_model.classes_)
regular_season_all_classification_model_confusion_matrix_display.plot()
plt.show()

np.random.seed(100)

play_offs_all_predictors_training,play_offs_all_predictors_testing,play_offs_all_WL_training,play_offs_all_WL_testing = train_test_split(play_off_totals[["fieldGoalsMade","threePointersMade","freeThrowsMade","reboundsTotal","assists","blocks","steals","foulsPersonal","turnovers","fieldGoalsAttempted","threePointersAttempted","freeThrowsAttempted","steals","foulsPersonal","turnovers","fieldGoalsAttempted","threePointersAttempted","freeThrowsAttempted"]],
                                                                                 play_off_totals["WL"],test_size=0.2)

standard_scaler = StandardScaler()
play_offs_all_predictors_training = standard_scaler.fit_transform(play_offs_all_predictors_training)
play_offs_all_predictors_testing = standard_scaler.transform(play_offs_all_predictors_testing)

play_offs_all_classification_model = LogisticRegression()

play_offs_all_classification_model.fit(play_offs_all_predictors_training,play_offs_all_WL_training)

play_offs_all_classification_model_predictions = play_offs_all_classification_model.predict(play_offs_all_predictors_testing)

play_offs_all_classification_model_accuracy = accuracy_score(play_offs_all_WL_testing,play_offs_all_classification_model_predictions)

play_offs_all_classification_model_confusion_matrix = confusion_matrix(play_offs_all_WL_testing,play_offs_all_classification_model_predictions)

play_offs_all_classification_model_accuracy

0.8414376321353065

play_offs_all_classification_model_confusion_matrix_display = ConfusionMatrixDisplay(confusion_matrix=play_offs_all_classification_model_confusion_matrix,display_labels=play_offs_all_classification_model.classes_)
play_offs_all_classification_model_confusion_matrix_display.plot()
plt.show()

Statistical Modelling¶

Initial Loading¶

Statistical Modelling (Team-Level)¶

Main Classification Models¶

Comparison with Other Models¶

Conclusion¶