{ "cells": [ { "metadata": {}, "cell_type": "markdown", "source": "## Линейная регрессия Предобработка\n\n### Предсказания Стоимости Квартиры\n\n#### Данные из Москвы\n\n\n- В предыдущем модуле **мы сделали предобработку** данных о квартирах, выставленных на продажу\n- Две важные обработки для линейных моделей; `стандартизация` и уборка `мультиколлиальных` фичей\n- Данные готовы для построения регрессионной модели\n- Попробуем предсказать цену на квартиры с помощью нескольких признаков квартиры\n\n### Импортируем библиотеки" }, { "metadata": { "trusted": false }, "cell_type": "code", "source": "import pandas as pd\nimport numpy as np\nimport matplotlib.pyplot as plt\n%matplotlib inline", "execution_count": 2, "outputs": [] }, { "metadata": {}, "cell_type": "markdown", "source": "### Читаем данные\n\n- Подгрузим данные и постмотрим на первые строки " }, { "metadata": { "trusted": false }, "cell_type": "code", "source": "#Подгрузим файл и посмотрим на его пкрвые строки\ndata = pd.read_csv('data_flats2.csv.xls',sep=';')\ndata.head()", "execution_count": 3, "outputs": [ { "data": { "text/html": "
\n | id | \nfull_sq | \nlife_sq | \nfloor | \npreschool_education_centers_raion | \nschool_education_centers_raion | \nschool_education_centers_top_20_raion | \nuniversity_top_20_raion | \nsport_objects_raion | \nadditional_education_raion | \n... | \nshopping_centers_raion | \nmetro_km_walk | \nkindergarten_km | \nschool_km | \npark_km | \ngreen_zone_km | \nmkad_km | \nbulvar_ring_km | \nkremlin_km | \nprice_doc | \n
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n1 | \n43 | \n27.0 | \n4.0 | \n5 | \n5 | \n0 | \n0 | \n7 | \n3 | \n... | \n16 | \n1.131260 | \n0.145700 | \n0.177975 | \n2.158587 | \n0.600973 | \n1.422391 | \n13.675657 | \n15.156211 | \n5850000 | \n
1 | \n2 | \n34 | \n19.0 | \n3.0 | \n5 | \n8 | \n0 | \n0 | \n6 | \n1 | \n... | \n3 | \n0.635053 | \n0.147754 | \n0.273345 | \n0.550690 | \n0.065321 | \n9.503405 | \n8.132640 | \n8.698054 | \n6000000 | \n
2 | \n3 | \n43 | \n29.0 | \n2.0 | \n4 | \n7 | \n0 | \n0 | \n5 | \n1 | \n... | \n0 | \n1.445960 | \n0.049102 | \n0.158072 | \n0.374848 | \n0.453172 | \n5.604800 | \n8.054252 | \n9.067885 | \n5700000 | \n
3 | \n4 | \n89 | \n50.0 | \n9.0 | \n9 | \n10 | \n0 | \n0 | \n17 | \n6 | \n... | \n11 | \n0.963802 | \n0.179441 | \n0.236455 | \n0.078090 | \n0.106125 | \n2.677824 | \n18.309433 | \n19.487005 | \n13100000 | \n
4 | \n5 | \n77 | \n77.0 | \n4.0 | \n7 | \n9 | \n0 | \n2 | \n25 | \n2 | \n... | \n10 | \n0.688859 | \n0.247901 | \n0.376838 | \n0.258289 | \n0.236214 | \n11.616653 | \n0.787593 | \n2.578671 | \n16331452 | \n
5 rows × 21 columns
\n