Свёртoчныe нeйрoнныe сeти (aнгл. Convolutional neural networks — CNN), вдoxнoвлённыe биoлoгичeскими прoцeссaми в зритeльнoй кoрe чeлoвeкa, xoрoшo пoдxoдят исполнение) тaкиx зaдaч, кaк рaспoзнaвaниe oбъeктoв и лиц, нo пoвышeниe тoчнoсти иx рaбoты трeбуeт утoмитeльнoй и тoнкoй нaстрoйки. Видишь почему учёные изо исследовательского отдела Google AI изучают новые модели, которые «масштабируют» CNN «более структурированным» способом. Продукт своей работы они опубликовали в статье «EfficientNet: пересмотр масштабирования моделей исполнение) свёрточных нейронных сетей», размещённой получи научном портале Arxiv.org, а вот и все в публикации в своём блоге. Соавторы утверждают, сколько семейство систем искусственного интеллекта, получившее топоним EfficientNets, превосходит верность стандартных CNN и повышает полезное действие нейронной сети по 10 раз.
«Обычная опыт масштабирования моделей заключается в произвольном увеличении глубины или — или ширины CNN, а также использовании большего разрешения входного изображения про обучения и оценки», — пишут списочный инженер-программист Минсинг Тан (Mingxing Tan) и задающий ученый в Google AI Куок Ли (Quoc V. Le). «В разность от традиционных подходов, которые без всякого основания масштабируют параметры мережа, такие как масштаб. Ant. длина, глубина и входящее энергоразрешение, наш метод мерно масштабирует каждое определение с фиксированным набором коэффициентов масштабирования».
Пользу кого дальнейшего повышения производительности исследователи выступают ради использование новой базовой ставная — мобильной инвертированной свёртки узкого места (англ. mobile inverted bottleneck convolution — MBConv), которая служит основой ради семейства моделей EfficientNets.
В тестах EfficientNets продемонстрировало что более высокую пунктуальность, так и лучшую непроизводительность по сравнению с существующими CNN, получи порядок уменьшив востребование к размеру параметров и вычислительным ресурсам. Одна изо моделей — EfficientNet-B7, продемонстрировала в 8,4 раза меньшенький размер и в 6,1 раза лучшую режим, чем известная CNN Gpipe, а в свою очередь достигла 84,4 % и 97,1 % точности (Топ-1 и Топ-5 творение) в тестировании на наборе ImageNet. За сравнению с популярной CNN ResNet-50, другая пример EfficientNet — EfficientNet-B4, используя аналогичные заряд, продемонстрировала точность в 82,6 % поперек 76,3 % у ResNet-50.
Модели EfficientNets оттяг показали себя и возьми других наборах данных, достигнув высокой точности в пяти изо восьми тестов, включительно наборы CIFAR-100 (несомненность 91,7 %) и Flowers (98,8 %).
«Обеспечивая значительные улучшения эффективности нейронных моделей, я ожидаем, что EfficientNets потенциально может наслужиться новой основой исполнение) будущих задач в области компьютерного зрения», — пишут Тан и Ли.
Первоначальный код и учебные сценарии ради облачных тензорных процессоров (TPU) с Google находятся в свободном доступе получай Github.