Перейти к содержимому

Калькулятор линейной регрессии

Вычисляет линейную регрессию по точкам данных: наклон, пересечение, R² и прогнозы.

#XY
1
2
3
4
5

Об этом инструменте

Линейная регрессия — это фундаментальный статистический метод, который моделирует взаимосвязь между двумя переменными путём подгонки прямой линии к набору точек данных. Этот калькулятор помогает вам найти линию наилучшего соответствия, вычислить наклон и точку пересечения, а также измерить качество соответствия ваших данных линейной модели с помощью значения R². Независимо от того, анализируете ли вы тренды в данных о продажах, сравниваете результаты экспериментов или исследуете корреляции в научных исследованиях, понимание линейных отношений необходимо для принятия решений на основе данных.

Чтобы использовать этот инструмент, просто введите точки данных в виде пар значений X и Y, затем нажмите кнопку Вычислить и получите мгновенно наклон (скорость изменения), точку пересечения (где линия пересекает ось Y), коэффициент R² (показатель качества соответствия от 0 до 1, где 1 означает идеальное соответствие) и уравнения предсказания. Инструмент также позволяет ввести новое значение X, чтобы предсказать соответствующее значение Y на основе подогнанной модели.

Этот калькулятор идеален для студентов, изучающих статистику, исследователей, проверяющих гипотезы, и специалистов, выявляющих тренды в бизнес-показателях. Имейте в виду, что линейная регрессия предполагает, что ваша взаимосвязь приблизительно линейна; если ваши данные показывают криволинейную закономерность или широкое разброс, модель может быть ненадежной. Для более сложных взаимосвязей рассмотрите полиномиальные или другие нелинейные регрессии.

Часто задаваемые вопросы

Реализация кода

def linear_regression(x: list, y: list) -> dict:
    n = len(x)
    if n < 2:
        raise ValueError("Need at least 2 data points")
    sum_x = sum(x)
    sum_y = sum(y)
    sum_xy = sum(xi * yi for xi, yi in zip(x, y))
    sum_x2 = sum(xi ** 2 for xi in x)
    mean_x = sum_x / n
    mean_y = sum_y / n

    slope = (n * sum_xy - sum_x * sum_y) / (n * sum_x2 - sum_x ** 2)
    intercept = mean_y - slope * mean_x

    # R-squared
    ss_res = sum((yi - (slope * xi + intercept)) ** 2 for xi, yi in zip(x, y))
    ss_tot = sum((yi - mean_y) ** 2 for yi in y)
    r2 = 1 - ss_res / ss_tot if ss_tot != 0 else 1.0

    return {"slope": slope, "intercept": intercept, "r_squared": r2,
            "pearson_r": r2 ** 0.5 if r2 >= 0 else 0}

x = [1, 2, 3, 4, 5]
y = [2.1, 3.9, 6.2, 7.8, 10.1]
result = linear_regression(x, y)
print(f"y = {result['slope']:.4f}x + {result['intercept']:.4f}")
print(f"R² = {result['r_squared']:.4f}")

# Predict
x_new = 6
y_pred = result['slope'] * x_new + result['intercept']
print(f"Prediction at x=6: {y_pred:.2f}")

Comments & Feedback

Comments are powered by Giscus. Sign in with GitHub to leave a comment.