реалізуючи кращий метод за допомогою статистичних балів

У мене є 7000 примірників даних.

У мене ці випадки вручну зараховані людиною (посилання).

У мене різні Двигуни, щоб автоматично визначати бали даних.

У мене є таблиця Excel, котра кожен стовпець описує оцінку певного двигуна та один стовпчик даних, отриманих вручну.

Я хочу знати, який із двигунів ближче до оцінки людини, використовуючи будь-які функції Excel, програмування, або просто дайте мені просту математику, і я буду працювати.

Оцінювання даних становить від -3,0 до +3,0

Я використовую C# для цієї програми та бібліотеки .NET Excel COM для доступу до сторінки Excel.

-UPDATE-

Статистично кажучи, що найкращий спосіб описати помилку, я маю на увазі, що оцінка людини, як правило, близька до нейтральності (0), але показники двигунів, як правило, упереджені (вище 1,5 +/-) Я хочу визначити найкраще рівняння для правильного опису та перебільшення помилки.

1
@Mranz "Я хочу знати, який із двигунів ближче до забиття людини ..."
додано Автор SKandeel, джерело
@ MerlynMorgan-Graham Звичайний, просто взявши середній бал кожного двигуна і наказавши їх ближче до далі/з ручного рахунку.
додано Автор SKandeel, джерело
Можливо, ви захочете спробувати це питання на крос-схваленій версії , оскільки, як мені здається, варто більше про статистичний аналіз, ніж про програмування
додано Автор AakashM, джерело
Яке питання?
додано Автор Mranz, джерело

3 Відповіді

Я б запропонував використовувати середню квадратну помилку. Для кожного екземпляру даних обчислити квадрат різниці для кожного двигуна. Це перебільшує помилку і дасть позитивні числа. Тоді ви берете середню квадратну помилку для кожного двигуна. Найнижча була б "найближча" оцінка людини.

4
додано
Ви маєте на увазі середню квадратну помилку (сума всіх помилок +7000 квадратів/+ 7000) ??
додано Автор SKandeel, джерело
так, що він би набрав.
додано Автор Captain Coder, джерело

Зазвичай робиться шляхом віднімання коефіцієнта двигуна від людського балу, взявши абсолютну величину, а потім підсумовуючи всі 7000. Двигун з найменшою сумою є найближчим.

1
додано
Це один із способів зробити це, хоча це не обов'язково найкраще. Наприклад, Двигун 1 може мати розбіжності, які розсіюються по всьому, але його загальна середня дещо краща, ніж Двигун 2, відмінності якого завжди перевищують кілька відсотків балів людини. Який з двох краще?
додано Автор Jim Mischel, джерело

Евклідова відстань між наборами даних повинна бути достатньою, якщо кожна точка даних однаково діапазон Для чіткості, екземпляри даних будуть пронумеровані, а движки будуть позначені буквами. Якщо оцінка, надана людиною в точці даних i , є H_i , а оцінка, надана движком a , є Ea_i , то помилка (як "не закриває" даний движок) для двигуна a :

ERROR(a) = (H_1 - Ea_1)^2 + (H_2 - Ea_2)^2 + … + (H_7000 - Ea_7000)^2

Найближчим двигуном є двигун, для якого помилка є найменшою.

1
додано
var chat = new Chat();
var chat = new Chat();
642 учасників

Обсуждение вопросов по C# / .NET / .NET Core / .NET Standard / Azure Сообщества-организаторы: — @itkpi — @dncuug