--- language: - pt datasets: - fetch_california_housing pipeline_tag: tabular-regression tags: - Regressão - Califórnia - sklearn --- ## Descrição do modelo: Este é um modelo de regressão linear treinado no conjunto de dados de habitação da Califórnia. O modelo foi treinado para prever o valor mediano das casas em um determinado bairro na Califórnia com base em várias características do bairro, como a renda média, a idade média da casa, o número médio de quartos, o número médio de ocupantes por casa, a latitude e a longitude. O modelo foi avaliado usando várias métricas de erro, incluindo o Erro Quadrático Médio (MSE), o Erro Absoluto Médio (MAE) e o Coeficiente de Determinação (R^2). Além disso, a validação cruzada foi usada para obter uma estimativa mais robusta do desempenho do modelo. Os coeficientes do modelo fornecem uma indicação da importância relativa de cada característica na previsão do valor mediano das casas. Por exemplo, um coeficiente positivo para a renda média sugere que bairros com maior renda média tendem a ter casas mais caras, enquanto um coeficiente negativo para a latitude sugere que bairros mais ao norte tendem a ter casas menos caras. Este modelo é um exemplo de um modelo de aprendizado de máquina simples e interpretable que pode ser usado como um ponto de partida para tarefas de previsão mais complexas. ## Métricas de avaliação: Erro Quadrático Médio: 0.5558915986952441 Erro Absoluto Médio: 0.5332001304956565 Coeficiente de Determinação (R^2): 0.575787706032451 Erro Quadrático Médio Médio da Validação Cruzada: 0.5582901717686553 Coefficient MedInc 0.852382 HouseAge 0.122382 AveRooms -0.305116 AveBedrms 0.371132 Population -0.002298 AveOccup -0.036624 Latitude -0.896635 Longitude -0.868927