П. Браздил - Метаобучение Применение в AutoML и науке о данных
Название: | Метаобучение Применение в AutoML и науке о данных | |
Автор: | П. Браздил | |
Жанр: | Учебники и самоучители по компьютеру | |
Изадано в серии: | неизвестно | |
Издательство: | неизвестно | |
Год издания: | - | |
ISBN: | неизвестно | |
Отзывы: | Комментировать | |
Рейтинг: | ||
Поделись книгой с друзьями! Помощь сайту: донат на оплату сервера |
Краткое содержание книги "Метаобучение Применение в AutoML и науке о данных"
Читаем онлайн "Метаобучение Применение в AutoML и науке о данных". [Страница - 201]
можно использовать в дальнейшей обработке, например
обсуждаемой в следующем разделе.
Выбор подходящего предметно-ориентированного
метазнания
Этот вопрос актуален для любой системы, стремящейся решать достаточно разнообразные задачи. В данном контексте предметно-ориентированные мета
знания включают в себя метаданные, метазнания, полученные в предыдущих
задачах, и определение соответствующих пространств конфигураций (мета
знания о конфигурации). Преимущество такого структурированного подхода
в том, что он позволяет сосредоточиться на меньшем пространстве конфигураций и, следовательно, упрощает поиск потенциально лучшего решения.
Получение данных
Этот шаг легко выполняется, если кто-то уже сообщил системе, где находятся
данные. Обычно данные хранятся и извлекаются из какой-либо базы данных
или OLAP. Однако на этом этапе могут возникнуть проблемы, если мы хотим,
чтобы система была более независимой и не всегда полагалась на помощь человека. Как было отмечено в разделе 14.2, мы можем столкнуться с задачей,
для которой почти нет доступных данных. Большая часть научной работы,
выполняемой людьми, относится к этому типу. Ученый должен разработать
план, который обычно включает некоторую форму взаимодействия с внешним миром или соответствующими источниками информации (например,
сайтами в интернете), чтобы получить необходимые данные. В разделе 14.2
мы упоминаем, например, систему Robot Scientist, которая делает именно
это. Некоторые системы обработки данных следующего поколения в той или
иной мере способны на самостоятельное получение данных.
Изменение детализации представления
Эта область также не лишена проблем. Как отмечено в главе 14, многие практические приложения используют информацию в базах данных или в кубе
OLAP для создания соответствующих агрегированных данных, чтобы иметь
возможность выполнить их интеллектуальный анализ. Хотя в прошлом этот
вопрос рассматривался в некоторых публикациях, и эта тема имеет первостепенное значение для многих практических приложений, похоже, что она
не удостоилась должного внимания на некоторых недавних семинарах по
науке о данных (например, упомянутый выше ADS 2019).
Однако, как указано в главе 15, помимо упомянутого выше агрегирования, можно рассмотреть и другие способы изменения детализации. Вопрос
заключается в том, можно ли включить эти процессы в более совершенную
систему AutoDS.
426 Заключительные соображения
18.3.8. Автоматизация проектирования решений
с более сложными структурами
В главе 15 мы обсуждали различные перспективные направления исследований. Было сказано, что не все решения можно представить в виде рабочих
процессов, так как иногда нужны более сложные структуры (например, условные операторы, итерация и т. д.). Следовательно, проблема заключается
в том, как расширить существующие подходы метаобучения/AutoML, чтобы
получать решения с более сложной структурой.
18.3.9. Проектирование платформ
метаобучения/AutoML
В этой книге мы не только обсудили различные теоретические подходы, но
и привели подробную информацию о соответствующих прикладных системах. Особое внимание было уделено существующим платформам метаобучения/AutoML, поскольку их обычно можно применять для решения множества
разнообразных задач. Поэтому платформы очень важны не только для будущих исследований, но и для развертывания рабочих приложений.
Однако платформы не всегда включают последние достижения в этой области. Наша задача заключается в расширении существующих платформ,
разработке новых и проведении сравнительных исследований, позволяющих
определить более конкурентоспособные варианты для дальнейшей работы.
18.4. Заключение и обращение
к читателям
За последние пару лет мы увидели много новых решений как старых, так
и новых проблем, и в этом контексте возникло много новых вызовов. С появлением AutoML и метаобучения для глубоких нейронных сетей появились
новые исследовательские сообщества. Мы надеемся, что мы вызвали интерес
у читателя, который вдохновит его на участие в разработке соответствующих
решений. Мы планируем рассмотреть новые проблемы и пути их решения
в следующем издании книги.
18.5. Литература
König, M., Hoos, H. H., and van Rijn, J. N. (2020). Towards algorithm-agnostic uncertainty estimation: Predicting classification error in an automated machine learning
setting. In 7th ICML Workshop on Automated Machine Learning --">
обсуждаемой в следующем разделе.
Выбор подходящего предметно-ориентированного
метазнания
Этот вопрос актуален для любой системы, стремящейся решать достаточно разнообразные задачи. В данном контексте предметно-ориентированные мета
знания включают в себя метаданные, метазнания, полученные в предыдущих
задачах, и определение соответствующих пространств конфигураций (мета
знания о конфигурации). Преимущество такого структурированного подхода
в том, что он позволяет сосредоточиться на меньшем пространстве конфигураций и, следовательно, упрощает поиск потенциально лучшего решения.
Получение данных
Этот шаг легко выполняется, если кто-то уже сообщил системе, где находятся
данные. Обычно данные хранятся и извлекаются из какой-либо базы данных
или OLAP. Однако на этом этапе могут возникнуть проблемы, если мы хотим,
чтобы система была более независимой и не всегда полагалась на помощь человека. Как было отмечено в разделе 14.2, мы можем столкнуться с задачей,
для которой почти нет доступных данных. Большая часть научной работы,
выполняемой людьми, относится к этому типу. Ученый должен разработать
план, который обычно включает некоторую форму взаимодействия с внешним миром или соответствующими источниками информации (например,
сайтами в интернете), чтобы получить необходимые данные. В разделе 14.2
мы упоминаем, например, систему Robot Scientist, которая делает именно
это. Некоторые системы обработки данных следующего поколения в той или
иной мере способны на самостоятельное получение данных.
Изменение детализации представления
Эта область также не лишена проблем. Как отмечено в главе 14, многие практические приложения используют информацию в базах данных или в кубе
OLAP для создания соответствующих агрегированных данных, чтобы иметь
возможность выполнить их интеллектуальный анализ. Хотя в прошлом этот
вопрос рассматривался в некоторых публикациях, и эта тема имеет первостепенное значение для многих практических приложений, похоже, что она
не удостоилась должного внимания на некоторых недавних семинарах по
науке о данных (например, упомянутый выше ADS 2019).
Однако, как указано в главе 15, помимо упомянутого выше агрегирования, можно рассмотреть и другие способы изменения детализации. Вопрос
заключается в том, можно ли включить эти процессы в более совершенную
систему AutoDS.
426 Заключительные соображения
18.3.8. Автоматизация проектирования решений
с более сложными структурами
В главе 15 мы обсуждали различные перспективные направления исследований. Было сказано, что не все решения можно представить в виде рабочих
процессов, так как иногда нужны более сложные структуры (например, условные операторы, итерация и т. д.). Следовательно, проблема заключается
в том, как расширить существующие подходы метаобучения/AutoML, чтобы
получать решения с более сложной структурой.
18.3.9. Проектирование платформ
метаобучения/AutoML
В этой книге мы не только обсудили различные теоретические подходы, но
и привели подробную информацию о соответствующих прикладных системах. Особое внимание было уделено существующим платформам метаобучения/AutoML, поскольку их обычно можно применять для решения множества
разнообразных задач. Поэтому платформы очень важны не только для будущих исследований, но и для развертывания рабочих приложений.
Однако платформы не всегда включают последние достижения в этой области. Наша задача заключается в расширении существующих платформ,
разработке новых и проведении сравнительных исследований, позволяющих
определить более конкурентоспособные варианты для дальнейшей работы.
18.4. Заключение и обращение
к читателям
За последние пару лет мы увидели много новых решений как старых, так
и новых проблем, и в этом контексте возникло много новых вызовов. С появлением AutoML и метаобучения для глубоких нейронных сетей появились
новые исследовательские сообщества. Мы надеемся, что мы вызвали интерес
у читателя, который вдохновит его на участие в разработке соответствующих
решений. Мы планируем рассмотреть новые проблемы и пути их решения
в следующем издании книги.
18.5. Литература
König, M., Hoos, H. H., and van Rijn, J. N. (2020). Towards algorithm-agnostic uncertainty estimation: Predicting classification error in an automated machine learning
setting. In 7th ICML Workshop on Automated Machine Learning --">
Книги схожие с «Метаобучение Применение в AutoML и науке о данных» по жанру, серии, автору или названию:
Джулиан М. Бакнелл - Фундаментальные алгоритмы и структуры данных в Delphi Жанр: Учебники и самоучители по компьютеру Год издания: 2003 Серия: Программирование в delphi |
А. Д. Хомоненко, С. Е. Ададуров - Работа с базами данных в C++ Builder Жанр: Базы данных Год издания: 2006 |
Владимир Михайлович Илюшечкин - Основы использования и проектирования баз данных. Учебник для СПО Жанр: Базы данных Год издания: 2019 Серия: Профессиональное образование |