Как смоделировать недостающие данные? Имеется большой массив данных, а именно данные снятые с датчиков. В БД некоторые ячейки данных пустые. Какие есть методы дополнения недостающих данных на основе существующих? Может в екселе есть готовые решения?
P.S. усредненные значения на основе существующих данных не подходят ибо все это в конечном итоге загоняется в нейронку, а она сразу видит подобное и выдает "мол не хорошо средние значения брать"

21 Авг 2019 в 06:10
201 +1
0
Ответы
1

Есть несколько методов, которые можно использовать для заполнения недостающих данных на основе существующих:

Интерполяция: этот метод можно использовать, если данные изменяются плавно. Интерполяция позволяет оценить пропущенные значения на основе близлежащих известных данных.

Экстраполяция: если данные имеют тенденцию к постепенному изменению, можно использовать экстраполяцию, чтобы оценить недостающие данные на основе уже имеющихся.

Метод k-ближайших соседей: этот метод основан на сравнении набора данных с соседними значениями и присвоении недостающих данных на основе ближайших соседей.

Прогнозирование временных рядов: если у вас есть временные данные, можно использовать методы прогнозирования временных рядов, такие как ARIMA или SARIMA, чтобы заполнить недостающие данные.

В Excel можно использовать функции, такие как VLOOKUP, INDEX MATCH, IFERROR и другие, чтобы создать формулы для обработки недостающих данных. Однако, для более сложных методов может потребоваться использование специализированного программного обеспечения, такого как Python (с библиотеками pandas и scikit-learn) или R.

20 Апр 2024 в 13:22
Не можешь разобраться в этой теме?
Обратись за помощью к экспертам
Гарантированные бесплатные доработки в течение 1 года
Быстрое выполнение от 2 часов
Проверка работы на плагиат
Поможем написать учебную работу
Прямой эфир