Инструменты анализа данных- тест Синергии

Примерные вопросы и ответы на итоговый и компетентностный тест.

Завалены делами? Мы берём эту головную боль на себя: выполняем тесты безупречно, анонимно, и точно в срок. 

Так же выполняем ответы на тесты, курсовые работы, практики и дипломы в Синергии, МОИ, МТИ МОСАП.

1. По какому признаку классифицируются методы прогнозирования на два основных класса?
* по источнику информации
*по математическому методу применения
*по объему информации
*по способу представления
2. Модели последовательностей описывают …
правила или набор правил, в соответствии с которыми можно отнести описание любого нового *объекта к одному из классов
*функции, которые позволяют прогнозировать изменения непрерывных числовых параметров
*функциональные зависимости между зависимыми и независимыми показателями и переменными в понятной человеку форме
*группы, на которые можно разделить объекты, данные о которых подвергаются анализа
3. Общий алгоритм завершается:
*численными расчетами
*созданием графических моделей
*морфологическим анализом
*естественной детализацией дальнейших исследований
4. Что такое участок упреждения в прогнозировании?
*участок, на который «опирается» прогноз
*участок времени предыстории
*участок «обучения» выборки исходных данных
*участок, на который строится прогноз
5. Кластеризация — …
*это установление зависимости непрерывной выходной переменной от входных переменных
*эта группировка объектов (Наблюдений, событий) на основеданных, описывающих свойства объектов
*выявление закономерностей между связанными событиями
*это установление зависимости дискретной выходной переменной отвходных переменных
6. В описательных моделей относятся следующие модели данных:
*модели классификации и последовательностей
*регрессивные, кластеризации, исключений, итоговые и ассоциации
*классификации, кластеризации, исключений, итоговые и ассоциации
*модели классификации, последовательностей и исключений
7. В ходе эксперимента получена реализация двумерной выборки. Известно, что первое наблюдение (10,3), а второе (3,1). Можно сказать, что эти пары
*согласованы
*несогласованы
*коррелированны
*некоррелированны
8. В ходе эксперимента получена реализация двумерной выборки. Известно, что первое наблюдение (5,3), а второе (3,1). Можно сказать, что эти пары
*согласованы
*несогласованы
*коррелированны
*некоррелированны
9. В ходе эксперимента получена реализация двумерной выборки. Известно, что первое наблюдение (7,3), а второе (3,5). Можно сказать, что эти пары
*согласованы
*несогласованы
*коррелированны
*некоррелированны
10. Обогащение— …
*комплекс методов и процедур, направленных на устранениепричин, мешающих корректной обработке: аномалий, пропусков,дубликатов, противоречий, шумов и т.д.
*процесс дополнения данных некоторой информацией, позволяющей повысить эффективность развязку аналитических задач
*объект, содержащий структурированные данные, которые могут оказаться полезными для развязки аналитической задачи
*комплекс методов и процедур, направленных на извлечение данных изразличных источников, обеспечение необходимого уровня ихинформативности и качества, преобразования в единый формат, в котором они могут быть загружены в хранилище данных или аналитическую систему
11. Задача кластеризации заключается в …
*нахождения частых зависимостей между объектами или событиями
*определения класса объекта по его характеристиками
*определение по известным характеристиками объекта значение некоторого его параметра
*поиска независимых групп и их характеристик в всем множестве анализируемых данных
12. Задача регрессии сводится к …
*нахождения частых зависимостей между объектами или событиями,
*определения класса объекта по его характеристиками
*определение по известным характеристиками объекта значения некоторого его параметра
*поиска независимых групп и их характеристик в всем множестве анализируемых данных
13. Информационные технологии обработки данных предназначены…
*для решения хорошо структурированных задач, по которым имеются необходимые входные данные и известны алгоритмы и другие стандартные процедуры их обработки
*для решения неструктурированных задач
*для передачи данных в системе управления
*для решения хорошо структурированных задач, по которым нет необходимых входных данных и неизвестны алгоритмы и другие стандартные процедуры их обработки
14. Объяснение результатов обработки данных – это …
*визуализация
*апробация
* интерпретация
*экстраполяция
15. Итоговые модели обнаружат …
*исключительные ситуации в записях, которые резко отличаются произвольной признаку от основной множества записей
*ограничения на данные анализируемого массива
*закономерности между связанными событиями
*группы, на которые можно разделить объекты, данные о которых подвергаются анализа.
16. Чем оценивается точность прогноза?
*величиной доверительного интервала для заданной вероятности
*расхождением между наблюдаемыми и вычислительными величинами
*вероятностью осуществления прогноза в заданном интервале
*разницей между рассчитанными разными методами величиной
17. Как называется графическое представление результатов обработки данных?
*корреляция
*визуализация
*интерполяция
*экстраполяция
18. Транзакция — …
*некоторый набор операций над базой данных, который рассматривается как единственное завершено, с точки зрения пользователя, действие над некоторой информацией, обычно связано с обращением к базе данных
*разновидность систем хранения, ориентирована на поддержку процессаанализа данных целостность, обеспечивает, непротиворечивость ихронологию данных, а также высокую скорость выполнения аналитическихзапросов
*высокоуровневые средства отражения информационной модели и описания структуры данных
*это установление зависимости дискретной выходной переменной от входных переменных
19. Как подразделяются прогнозы по виду представления?
*на интервальные и точечные
*на поисковые и нормативные
*на экономические, социальные и др.
*на графические и табличные
20. Какой из модулей ППП Статграфикс входит в состав базовых?
*контроль качества
*сравнение данных
*планирование эксперимента
*многомерные методы
21. Какой модуль ППП Статграфикс определяет экстремум функции отклика исследуемой системы?
*описания данных
*планирование эксперимента
*сравнение данных
*анализ временных рядов
22. Какую проблему не решают задачи кластеризации, отыскивая ‘скрытую структуру’ исследуемых данных и не имея опорной целевой переменной?
*разметка данных ‘вручную’ очень дорого и трудозатратно
*построение признаков из очень большего количества данных
*возможность отслеживать эволюционные изменения
*поиск выбросов и шумов в исследуемых данных
23. Кластеризация — …
*это установление зависимости непрерывной выходной переменной отвходных переменных
*эта группировка объектов (Наблюдений, событий) на основеданных, описывающих свойства объектов
*выявление закономерностей между связанными событиями
*это установление зависимости дискретной выходной переменной от входных переменных
24. Консолидация— …
*комплекс методов и процедур, направленных на устранениепричин, мешающих корректной обработке: аномалий, пропусков,дубликатов, противоречий, шумов и т.д.
*процесс дополнения данных некоторой информацией, позволяющей повысить эффективность развязку аналитических задач
*объект, содержащий структурированные данные, которые могут оказаться полезными для развязки аналитической задачи
*комплекс методов и процедур, направленных на извлечение данных изразличных источников, обеспечение необходимого уровня ихинформативности и качества, преобразования в единый формат, в котором они могут быть загружены в хранилище данных или аналитическую систему
25. Метаданные — …
*некоторый набор операций над базой данных, который рассматривается как единственное завершено, с точки зрения пользователя, действие над некоторой информацией, обычно связано с обращением к базе данных
*разновидность систем хранения, ориентирована на поддержку процессаанализа данных целостность, обеспечивает, непротиворечивость ихронологию данных, а также высокую скорость выполнения аналитическихзапросов
*высокоуровневые средства отражения информационной модели и описания структуры данных
это установление зависимости дискретной выходной переменной от входных переменных
26. Аналитик это …
*специалист в области анализа и моделирования
*специалист в предметной области
*человек, решающий определенные задачи
*человек, который имеет опыт в программировании
27. Под методом понимается
*алгоритм решения нетиповой задачи по заданной постановке
*алгоритм решения типовой задачи по незаданной постановке
*алгоритм решения типовой задачи по заданной постановке
*алгоритм решения нетиповой задачи по незаданной постановке
28. Метод главных компонент – это метод…
*дисперсионного анализа
*факторного анализа
*кластерного анализа
*регрессионного анализа
29. Модели ассоциации проявляют …
*исключительные ситуации в записях, которые резко отличаются произвольной признаку от основной множества записей
*ограничения на данные анализируемого массива
*закономерности между связанными событиями
*группы, на которые можно разделить объекты, данные о которых подвергаются анализа.
30. Модели классификации описывают …
*правила или набор правил в соответствии с которыми можно отнести описание любого нового объекта к одному из классов
*функции, которые позволяют прогнозировать изменения непрерывных числовых параметров
*функциональные зависимости между зависимыми и независимыми показателями и переменными в понятной человеку форме
*группы, на которые можно разделить объекты, данные о которых подвергаются анализа
31. Аналитическая платформа — …
*специализированный программный решение (или набор решений),который включает в себя все инструменты для извлечения закономерностей из сырых данных
*эта группировка объектов (Наблюдений, событий) на основеданных, описывающих свойства объектов
*набор данных, каждая запись которого представляет собой учебный пример, содержащего заданный входной влияние, что и отвечает емуправильный выходной результат
*подразделение искусственного интеллекта изучающий методы построения алгоритмов, способных обучаться на данных
32. Модуль Статграфикс «анализ временных рядов» позволяет обрабатывать…
*трехмерный массив данных
*двухмерный массив данных
*одномерный массив данных
*четырехмерный массив данных
33. Основная задача кластеризации:
*отыскать ‘скрытую структуру’ данных
*разделить набор данных на предопределенные классы
*определить центр набора данных
*упорядочивание объектов в статистически однородные группы
34. Очистка данных — …
*комплекс методов и процедур, направленных на устранениепричин, мешающих корректной обработке: аномалий, пропусков,дубликатов, противоречий, шумов и т.д.
*процесс дополнения данных некоторой информацией, позволяющей повысить эффективность развязку аналитических задач
*объект, содержащий структурированные данные, которые могут оказаться полезными для развязки аналитической задачи
*комплекс методов и процедур, направленных на извлечение данных изразличных источников, обеспечение необходимого уровня ихинформативности и качества, преобразования в единый формат, в котором они могут быть загружены в хранилище данных или аналитическую систему
35. Выберите алгоритм, который не решают задачи кластеризации
*K-средних
*Деревья решений
*EM-алгоритм
*К-медиан
36. Дисперсионный анализ предназначен для…
*выбора закона распределения переменной
*прогнозирования переменной
*обнаружения влияния выделенного набора факторов на отклик исследуемой системы
*кластеризации данных
37. При построении математической модели возникает следующая проблема:
*определение числа параметров модели
*определение значений параметров модели
*выбор структуры модели
*выбор критерия оценки качества модели
38. Регрессивные модели описывают …
*правила или набор правил в соответствии с которыми можно отнести описание любого нового объекта к одному из классов
*числовых параметров
*функциональные зависимости между зависимыми и независимыми показателями и переменными в понятной человеку форме
*группы, на которые можно разделить объекты, данные о которых подвергаются анализа
39. Для построения гистограммы данных необходимо задать …
*величину периода упреждения
*число факторов
*число целевых функций
*число интервалов группирования
40. Регрессивные модели описывают …
*правила или набор правил, в соответствии с которыми можно отнести описание любого нового объекта к одному из классов
*функции, которые позволяют прогнозировать изменения непрерывных числовых параметров
*функциональные зависимости между зависимыми и независимыми показателями и переменными в понятной человеку форме
*группы, на которые можно разделить объекты, данные о которых подвергаются анализа
41. Кластерный анализ позволяет…
*построить прогноз
*построить регрессионную модель
*выбрать закон распределения
*разбить данные на классы
42. Регрессия — …
*это установление зависимости непрерывной выходной переменной отвходных переменных
*эта группировка объектов (Наблюдений, событий) на основеданных, описывающих свойства объектов
*выявление закономерностей между связанными событиями
*это установление зависимости дискретной выходной переменной от входных переменных
43. Доверительный интервал прогноза растет с:
*с увеличением периода упреждения прогноза
*с увеличением периода ретроспекции прогноза
*с уменьшением доверительной вероятности
*с уменьшением С.К.О. прогноза
44. Регрессия — …
*установление зависимости непрерывной выходной переменной отвходных переменных
*группировка объектов (Наблюдений, событий) на основеданных, описывающих свойства объектов
*выявление закономерностей между связанными событиями
*установление зависимости дискретной выходной переменной от входных переменных
45. К какой группе относится ППП Статграфикс?
*специализированный
* универсальный
*профессиональный
*фундаментальный
46. На какие два изначальных класса подразделяются методы прогнозирования?
*на математические и описательные
*на фактографические и экспертные
*на графические и символические
*на точечные и интервальные
47. У каждого из n объектов измеряется большое количество показателей. Требуется без нарушения существенной структуры данных перейти к пространству показателей меньшей размерности. Такая процедура сжатия возможна
*всегда
*в случае некоррелированности показателей
*никогда
*в случае сильной коррелированности показателей
48. Целью поиска ассоциативных правил является …
*нахождения частых зависимостей между объектами или событиями
*определения класса объекта по его характеристикам
*определение по известным характеристиками объекта значение некоторого его параметра
*поиска независимых групп и их характеристик в всем множестве анализируемых данных
49. Чем оценивается достоверность прогноза?
*оценка вероятности осуществления прогноза в заданном интервале
*шириной доверительного интервала для заданной вероятности
*суммой квадратов разностей между наблюдаемыми и расчетными величинами
*величиной вычисленной дисперсии
50. Ассоциация — …
*это установление зависимости непрерывной выходной переменной отвходных переменных
*эта группировка объектов (Наблюдений, событий) на основеданных, описывающих свойства объектов
*выявление закономерностей между связанными событиями
*это установление зависимости дискретной выходной переменной от входных переменных
51. Что позволяет корреляционный анализ?
*планировать эксперимент
*делать выводы о степени статистической связи между переменными.
*построить множественную регрессию
*построить прогноз
52. Что представляет собой участок ретроспекции в прогнозировании?
*участок времени на который строится прогноз
*участок времени, завершающийся точечный прогнозом
*участок времени, завершающийся интервальным прогнозом
*участок, на котором формируется прогноз
53. Классификация — …
*некоторый набор операций над базой данных, который рассматривается как единственное завершено, с точки зрения пользователя, действие над некоторой информацией, обычно связано с обращением к базе данных
*разновидность систем хранения, ориентирована на поддержку процесса анализа данных целостность, обеспечивает, непротиворечивость и хронологию данных, а также высокую скорость выполнения аналитических запросов
*высокоуровневые средства отражения информационной модели и описания структуры данных
*это установление зависимости дискретной выходной переменной от входных переменных
54. Что является важной частью анализа данных?
*создание данных
*сортировка данных
*редактирование данных
*удаление данных
55. Пошаговая множественная регрессия применяется для…
*максимизации количества независимых переменных, входящих в исследуемую модель
*установления статистической связи между переменными
*прогнозирования
*минимизации количества независимых переменных, входящих в исследуемую модель
56. Вид хранения исходных данных в среде Статграфикс?
*графический
*текстовый
*электронная таблица
*кодированный
57. Какой модуль позволяет решать задачу одномерного прогнозирования с помощью ППП Статграфикс?
*планирование эксперимента
*сравнение данных
*контроль качества
* анализ временных рядов
58. Сколько модулей составляют базу ППП Статграфикс?
*пять
*четыре
*два
*три
59. Какую из задач можно решить с помощью модуля Статграфикс «описания данных»?
*анализ одной переменной
*сравнение двух выборок
*построить простую регрессию
*кластерный анализ
60. Модели исключений описывают …
*исключительные ситуации в записях, которые резко отличаются произвольной признаку от основной множества записей
*ограничения на данные анализируемого массива
*закономерности между связанными событиями
*группы, на которые можно разделить объекты, данные о которых подвергаются анализа.
Какие основные этапы включает в себя процесс анализа данных?

Что представляет собой инструмент Power BI и в каких целях он используется?

Какую роль играет язык программирования Python в анализе данных?

В чем преимущества использования библиотеки Pandas при обработке табличных данных?

Для чего используется метод главных компонент (PCA) в анализе данных?

Что такое «очистка данных» и какие методы при этом применяются?

Какие типы визуализации данных чаще всего используются в Tableau?

Каково основное назначение SQL в контексте анализа данных?

В чем разница между описательной и предсказательной аналитикой?

Почему важно проводить предварительный разведывательный анализ данных (EDA)?

Какие инструменты позволяют проводить кластерный анализ?

Что такое outliers (выбросы), и как их можно обнаружить в наборе данных?

Как используется язык R в статистическом анализе?

Что понимается под корреляционным анализом в рамках аналитики данных?

Какие существуют метрики оценки качества модели машинного обучения?

В чем особенности использования Jupyter Notebook для аналитических задач?

Что такое дашборд, и какие элементы он может включать?

Какие методы используются для обработки пропущенных значений в датасете?

Каковы основные функции инструмента Google Data Studio?

Почему важно нормализовать данные перед проведением анализа?

81. Какой из инструментов чаще всего используется для визуализации данных?
*Tableau
*MySQL
*Jupyter
TensorFlow

82. Какая библиотека в Python предназначена для работы с табличными данными?
*NumPy
*Pandas
*Matplotlib
Seaborn

83. Что делает функция describe() в библиотеке Pandas?
*Строит график
*Удаляет пропущенные значения
*Возвращает статистические характеристики данных
Объединяет таблицы

84. Для чего чаще всего используется язык SQL в аналитике?
*Построение диаграмм
*Запрос и управление данными в базе
*Машинное обучение
Сжатие данных

85. Какая метрика используется для оценки точности классификационной модели?
*MSE
*R2
*Accuracy
RMSE

86. Что представляет собой диаграмма рассеяния (scatter plot)?
*Диаграмма распределения частот
*График линейной зависимости
*График взаимосвязи между двумя переменными
График значений по категориям

87. Какой тип анализа включает выявление закономерностей в исторических данных?
*Диагностический
*Предиктивный
*Описательный
Регрессионный

88. Что такое кластеризация в анализе данных?
*Удаление выбросов
*Прогнозирование значений
*Разделение данных на группы по сходству
Агрегация данных

89. Какой формат чаще всего используется для хранения и обмена структурированными данными?
*PDF
*XLSX
*CSV
PNG

90. Что делает функция dropna() в Pandas?
*Добавляет пропущенные значения
*Заменяет нули на NaN
*Удаляет строки с пропущенными значениями
Сортирует данные по столбцу

91. Какая библиотека Python используется для построения графиков и диаграмм?
*Scikit-learn
*Matplotlib
*NumPy
Pygame

92. В каком инструменте создаются отчёты на основе данных Google?
*Power BI
*Google Analytics
*Google Data Studio
Google Sheets

93. Что такое boxplot?
*Гистограмма плотности
*Диаграмма размаха, показывающая медиану и выбросы
*Круговая диаграмма
Столбчатая диаграмма по категориям

94. Какой инструмент чаще всего используется для построения моделей машинного обучения?
*Scikit-learn
*Excel
*Tableau
SQL Server

95. Какая функция используется в Excel для расчета среднего значения?
*COUNT
*SUM
*AVERAGE
IF

96. Что такое корреляция?
*Причинно-следственная связь
*Математическое моделирование
*Связь между двумя переменными
Сортировка данных по алфавиту

97. Какой метод используется для уменьшения размерности данных?
*K-средних
*PCA
*Random Forest
Gradient Boosting

98. Что такое ETL в контексте анализа данных?
*Распознавание образов
*Сбор, трансформация и загрузка данных
*Обучение моделей
Хранение резервных копий

99. Какой показатель показывает разброс данных относительно среднего?
*Мода
*Медиана
*Среднеквадратичное отклонение
Коэффициент детерминации

100. Что является первым этапом при работе с новым набором данных?
*Обучение модели
*Построение графиков
*Очистка и предварительный анализ
Экспорт отчёта
101. Какая библиотека Python используется для статистической визуализации?
*Scipy
*Pandas
*Seaborn
XGBoost

102. Что делает метод groupby() в Pandas?
*Удаляет дубликаты
*Создаёт сводные таблицы
*Группирует данные по заданному признаку
Строит графики

103. Какой инструмент лучше всего подходит для построения интерактивных дашбордов?
*Jupyter Notebook
*Tableau
*Excel
Notepad++

104. Что такое регрессионный анализ?
*Метод прогнозирования значений на основе зависимостей
*Кластеризация объектов по признакам
*Анализ изображений
Метод проверки гипотез

105. Что означает термин ‘чистка данных’?
*Удаление всех данных из набора
*Удаление некачественных, дублирующихся или отсутствующих данных
*Добавление новых строк
Сортировка по убыванию

106. Какая функция в NumPy используется для создания массива случайных чисел?
*rand()
*array()
*mean()
sort()

107. В каком формате чаще всего сохраняются модели машинного обучения?
*.csv
*.xlsx
*.pkl
.txt

108. Какой инструмент позволяет проводить SQL-запросы и визуализацию данных в одном интерфейсе?
*Visual Studio
*Google Data Studio
*Apache Superset
JupyterLab

109. Что такое тепловая карта (heatmap) в анализе данных?
*Карта с геоданными
*Таблица с цветовой индикацией значений
*Гистограмма
Кластерная диаграмма

110. Какой метод часто используется для борьбы с мультиколлинеарностью в данных?
*Стандартизация
*Удаление коррелирующих переменных
*Кодирование категорий
Анализ главных компонент

111. Что такое feature engineering?
*Создание новых признаков на основе имеющихся
*Построение графиков
*Удаление строк
Оценка модели

112. Какой инструмент используется для автоматизации анализа данных в Excel?
*Power Query
*Solver
*VBA
PowerPoint

113. Что означает термин ‘overfitting’ в машинном обучении?
*Переобучение модели на тренировочных данных
*Недостаточная обученность
*Высокое качество визуализации
Удаление признаков

114. Что позволяет делать инструмент Apache Hadoop?
*Проводить глубокое обучение
*Обрабатывать большие объёмы данных распределённо
*Создавать дашборды
Рисовать графики

115. Какая метрика используется для оценки точности регрессионной модели?
*F1-score
*R² (коэффициент детерминации)
*Accuracy
Recall

116. Что означает термин “data wrangling”?
*Обработка и приведение данных в пригодный вид
*Сбор данных с сайтов
*Шифрование данных
Упаковка архивов

117. Какая из следующих библиотек предназначена для обучения моделей машинного обучения в Python?
*OpenCV
*Scikit-learn
*Dash
Requests

118. Что такое dummy-переменные?
*Переменные без значения
*Категориальные переменные, преобразованные в числовые
*Ошибочные данные
Целевые переменные модели

119. Что представляет собой ROC-кривая?
*График зависимости точности от количества данных
*График соотношения истинных и ложных положительных результатов
*Карта корреляций
Карта кластеров

120. Для чего используется метод k-средних?
*Для уменьшения размерности
*Для кластеризации объектов
*Для визуализации
Для предсказания числовых значений

Контакты

Свяжитесь с нами удобным способом

Телефон:
Мы в социальных сетях:
График работы:

с 9:00 до 21:00

без выходных

Адрес:

г. Москва, ул. Автомоторная 4А, стр. 21, офис 234