Среднее между гуманитарием и технарем

Среднее между гуманитарием и технарем

Ребята, мы вкладываем душу в AdMe.ru. Cпасибо за то,
что открываете эту красоту. Спасибо за вдохновение и мурашки.
Присоединяйтесь к нам в Facebook и ВКонтакте

Многие уверены, что всех людей можно разделить на гуманитариев и технарей. Но все никак не угаснут споры о том, в чем же различие между ними.

Современная система образования подразумевает, что школьники в какой-то момент должны четко определиться с профилем своего дальнейшего обучения. И чуть не с младших классов прозорливые мамы и папы начинают навешивать на детей ярлыки «гуманитарий» или «технарь». О том, почему не нужно поддаваться общему стремлению обязательно приписать ребенка к тем или другим, рассказывает психолог Татьяна Никитина.

«Вовка-то наш — чистый технарь. Смотри, как быстро он с новым фотоаппаратом без инструкции разобрался! И пылесос бабушке сам починил!».

«Полине светит дорога только в гуманитарный вуз — она в математике полный ноль, в элементарных примерах ошибается, зато читать любит».

Знакомые и даже заезженные реплики, не правда ли? При этом такие безобидные на первый взгляд шаблоны могут быть очень опасными для ребенка и его будущего. Особенно если бесконечно тиражировать их в присутствии самого «гуманитария» или «технаря».

Однажды промозглым мартовским днем девятиклассник Никита («прирождённый гуманитарий») вернулся домой из школы. В свои четырнадцать он говорил на трёх языках и уже во второй раз перечитывал романы Ремарка. Никита с порога заявил родителям:

— Сегодня у нас в классе проводили профориентацию. В тесте были шкалы «технарь» и «гуманитарий». Так вот, по шкале «технарь» у меня вышло больше баллов, чем по шкале «гуманитарий». Психолог сказала, что я мог бы стать успешным изобретателем.

Он довольно улыбнулся выдержал паузу и спустя некоторое время добавил:

— Она еще много чего мне говорила… О разных профессиях и специальностях; о таких, про которые я даже никогда не думал. Почему вы всегда называли меня гуманитарием?

Мама тоном, означавшим мгновенное окончание разговора, парировала:

— Потому что у тебя по алгебре-геометрии тройки с минусом, а по истории, литературе и языкам пятерки, которые даются тебе без усилий.

Тем не менее на следующий день Никита заявил родителям, что в намеченный иняз поступать не будет, потому что «…мне это скучно, и я всегда это чувствовал, только вам боялся сказать». Состоявшийся в итоге на день позже спор окончился ссорой и скандалом. После него растерянная мама Никиты бросилась звонить подругам, чтобы выяснить, как же ее сын («прирожденный гуманитарий») вдруг оказался «технарем»? А может, психологи ошиблись?! И если всё-таки нет, то как теперь быть: менять выбранное направление и настраиваться на другой вуз или же постараться убедить сына, что свою «техническую жилку» он сможет применить и будучи переводчиком-синхронистом?

Если вдруг для кого-то это важно, история Никиты и его семьи абсолютно реальная, и даже имена (вопреки расхожей практике) не изменены. Но гораздо важнее, конечно, выводы, которые можно и нужно сделать из этой истории.

В семье заметили, что Никита с детства обожает читать, и другие гуманитарные навыки тоже даются ему легко. Родители тут же (еще в младших классах) «записали» мальчика в гуманитарии. Ярлык прочно прилип: гуманитарными способностями мальчика восхищались родственники и учителя в гимназии, на будущее рассматривались профессии только из гуманитарной сферы. При этом плохие оценки по математике и физике родителей не волновали. Еще бы: их сын «гуманитарий», зачем требовать от него невозможное? Все выглядело на первый взгляд логично, но в итоге привело к коллапсу. Главная проблема в уповании на архаичное и вредное деление технарь/гуманитарий. Есть как минимум пять причин о нем забыть.

1. Мир — не чёрно-белый

Чистых «гуманитариев» и «технарей» в природе столь же мало, как и чистых правшей и левшей. Ведущая правая рука вовсе не означает, что ведущими будут и правая нога, и правый глаз, а значит, вы уже не чистый правша. Точно так же умение быстро считать в уме не всегда предполагает, что этот человек с таким же успехом понимает технические чертежи или совсем не разбирается в литературе. С другой стороны, школьник может с трудом складывать и вычитать в уме в пределах двадцати, но блестяще решать сложнейшие геометрические задачи. Это связано с особенностями развития тех или иных зон человеческого мозга каждого конкретного человека.

Безусловно, в мире есть люди, которых можно однозначно отнести к одной из категорий. Однако делать подобные выводы относительно детей все-таки не стоит. Практика показывает, что у многих школьников неплохо развиты как технические, так и гуманитарные навыки. Более того, различные зоны мозга у подростков развиваются неравномерно, поэтому не удивляйтесь, если ваш «гуманитарий» вдруг ударится в математику.

2. Больше, чем двоичный код

Кроме технического и гуманитарного направлений, существует, например, и естественнонаучное. Застряв в дилемме «гуманитарий/технарь», можно упустить момент для развития естественнонаучных навыков. К тому же сейчас активнее всего развиваются междисциплинарные направления, которые находятся на стыке наук. Куда зачислить экономистов и социологов, архитекторов и технических дизайнеров?

Почти все знакомые удивляются, когда я рассказываю, что на абсолютно гуманитарный на первый взгляд факультет психологии МГУ в мои годы решающим экзаменом была математика. После нее отсеивалось до 70% абитуриентов; а уже потом в университете мы изучали высшую математику, теорию вероятности и статистику.

3. Роль личности в истории (и других предметах)

Огромную роль (а иногда и решающую) в развитии заложенных природой способностей играют педагоги. Талантливый педагог может разбудить в ученике способности, о которых тот даже и не подозревал. Но известны, к сожалению, и обратные примеры, когда новый учитель умудрялся не только отбить интерес к любимому предмету, но и даже вызвать отвращение к нему.

Это очень тонкий момент: родителям нужно понять и почувствовать, когда недовольство учителем — это стандартная защитная реакция подростка, у которого что-то не выходит; а когда справедливый упрек и уместное разочарование. К сожалению, повлиять на конкретного учителя зачастую практически невозможно, поэтому проблема решается усилиями родителей и/или поиском грамотного (ключевое слово) репетитора. Причем решается иногда буквально за один-два месяца.

4. Ваши ожидания — его проблемы

Называя своего ребенка «гуманитарием» или же «технарем», родители, сами того не подозревая, оказывают на него перманентное давление. Чуткие дети улавливают «чего хочет папа» или «о чем мечтает мама» и, стараясь им угодить, нередко делают неверный выбор, предпочитая одно направление другому. Кроме неизбежных психологических проблем в будущем, это еще и ограничивает развитие личных талантов ребенка в настоящем.

Читайте также:  Программа которая режет музыку

5. Способности и интересы

Рассуждая о выборе направления, очень важно учитывать не только способности ребенка, но и его интересы. Это действительно разные вещи. Часто бывает, что школьнику очень нравится какой-то предмет, даже если он не до конца его понимает и у него далеко не все получается. Или же наоборот — учитель не смог заинтересовать предметом, и школьник не хочет прилагать усилий, чтобы разобраться в «неинтересном» материале. Огромная ошибка судить о гуманитарной или технической направленности, оперируя только лишь школьными оценками.

Если соотнести интересы и способности, мы получим несколько различных сценариев.

  1. Сфера интересна и способности развиты — идеальный вариант, можно смело думать о профессиональном развитии в данном направлении.
  2. Сфера неинтересна, но есть к ней есть способности. Здесь задача родителей задуматься, почему эта сфера ребенку неинтересна. Не повезло с педагогами? Нет представления о всем спектре специальностей, входящих в эту сферу? Или же больший интерес к другой сфере?
  3. Сфера интересна, но способности недостаточно развиты. Например, ребенка влечет к конструированию, а вот его способности по пространственному анализу явно не дотягивают до необходимого уровня. В этом случае имеет смысл либо больше заниматься, либо же обратить внимание на междисциплинарные области знаний.
  4. Сфера неинтересна, способностей в ней тоже нет. В этом случае все просто — нужно рассматривать другие сферы.
  5. По направлениям «гуманитарий» и «технарь» как интерес, так и способности средние. Это прежде всего знак того, что «свое» направление нужно искать в других сферах — естественнонаучной, творческой и других.

Очень важно понимать, что ответственность за свой выбор направления (гуманитарного, технического, естественнонаучного) должен нести ребенок и только ребенок. И ни в коем случае не стоит ему мешать, если он «вдруг» захочет это направление сменить. Всегда лучше сделать это в подростковом возрасте, а не бросив ВУЗ на 4 курсе или, что еще хуже, осознав в 40 лет, что всю жизнь занимался не тем. Важно дать ребенку определиться самому, сделать собственный выбор и нести за него ответственность.

Задача родителей при этом — дать ребенку как можно более полную информацию обо всех существующих областях знаний, а также типах профессий и специальностей. Помочь ребенку с выбором направления может профессиональное комплексное психологическое тестирование (профориентационное). Оно позволяет оценить и интересы, и успешность в решении задач. Кроме этого, оно может пробудить реальный интерес к профессиональной самореализации и, что очень важно, ощущение ответственности за свой выбор. Только очень прошу вас: не надо называть профориентационным тестированием веселые развлекательные тесты в интернете.

Ещё больше полезных текстов с лучшими советами психологов о воспитании и о том, как строить отношения в семье (чтобы никто не остался обиженным), в нашем телеграм-канале и на странице о детской психологии в фейсбуке.

Привет, хабр! Хочу поделиться своим опытом классификации пользователей социальной сети по их комментариям на два класса по складу ума: гуманитарный или технический. В данной статье не будут использоваться последние достижения глубокого обучения, но будет разобран завершенный проект по классификации текстов: от поиска подходящих данных до предсказаний. В конце будет представлено веб-приложение, в котором вы сможете проверить себя.

Постановка задачи

Задача в нашем случае бинарной классификации ставится так: есть пользователь, есть его комментарии, и по ним необходимо определить класс: гуманитарий или технарь. Для решения этой задачи применим техники машинного обучения и обработки естественного языка. Итоговый результат можно будет использовать, например, для таргетированной рекламы.

Данные

Существующей размеченной выборки нет: эти понятия сложно формализовать, и необходимо будет по каким-то признакам разделить пользователей на два класса.

Решено было собрать свой набор данных на основе комментариев пользователей социальной сети “ВКонтакте”. На публичных страницах люди обычно обсуждают посты или просто общаются, оставляя множество комментариев. Страница паблика/группы должна быть нейтральной тематики для того, чтобы количество гуманитариев и технарей примерно совпадало. Я выбрал публичную страницу, посвященную обсуждению жизни конкретного города. Количество подписчиков – около 300 тысяч, количество публикаций – около 50 тысяч, среднее количество комментариев к публикации – 20.

Получение и разметка данных

Выкачать все комментарии можно с помощью VK Open API, с помощью которого было получено около 3 миллионов комментариев от 130 тысяч пользователей. Этого количества должно с запасом хватить, чтобы обучить почти любую модель машинного обучения, но есть одно “но”: у нас нет разметки этих данных, мы не знаем, кто гуманитарий, а кто технарь. Конечно, можно было бы попытаться написать каждому из пользователей и спросить у них лично, но это сомнительная идея. Придется использовать те знания, которые мы можем получить со страниц пользователей.

Только у 11 тысяч человек из 130 был указан факультет образования. В результате такой фильтрации осталось только 170 тысяч комментариев, что составляет только 6% от исходного объема. Всего различных факультетов оказалось 160. Я разделил все факультеты на гуманитарные, технические и другие (естественные или вовсе не относящиеся к научным, например, музыкальные или художественные). Эти “другие” факультеты были отброшены и не участвовали в эксперименте. Каждому пользователю был присвоен класс в соответствие с факультетом, который был указан у него в профиле.

Возможно не все, кто учатся на гуманитарных факультетах, являются гуманитариями, и то же можно сказать о технических, но на общем фоне таких пользователей должно быть меньшинство. Для подтверждения или опровержения этой теории мною был организован соцопрос на своем факультете. Из 200 человек 62 (то есть 31%) указали, что их склад ума — гуманитарный несмотря на то, что сам факультет технический. Аналогично, на гуманитарном факультете из 150 опрошенных 14 человек (только 9%) признались в том, что они технари в душе. Таким образом, более правильно назвать классификацию по таким данным классификацией по типу полученного высшего образования.

Анализ данных

Пример таблицы с данными по комментариям:

Прежде чем переходить к построению моделей, необходимо провести анализ имеющейся выборки. Это поможет понять, какие признаки нужно учитывать, как они распределены и какие модели лучше использовать. Также это помогает найти выбросы и аномалии в данных, которые не типичны для данной выборки. Их удаление поможет построить модель с большей обобщающей способностью. После разделения пользователей в обоих классах получилось примерно по 4000 человек. Сначала посмотрим на распределение не текстовых признаков пользователей.

Читайте также:  Формула для вычисления расстояния между двумя точками

В выборке пользователей мужского пола оказалось 55%. В обществе существует стереотип, что у мужчин более аналитический склад ума, а у женщин — гуманитарный или творческий. По данным выборки построен график, который показывает распределение этого признака отдельно по двум классам.

Видно, что среди пользователей мужского пола преобладает класс «технарь», а среди пользователей женского пола — «гуманитарий».

Отношение к алкоголю

Около 1500 пользователей из каждого класса отметили своё отношение к алкоголю и около 1600 — к курению. Конечно, многие не заполняют этот пункт в социальных сетях, лишь у 30% он был указан. Какая-то часть могла указать заведомо ложную информацию, чтобы показать себя в лучшем свете или произвести впечатление на одноклассников. Но общая тенденция в различии двух классов все равно просматривается.

По оси абсцисс расположены категории от «очень негативное» до «позитивное» отношение к алкоголю. Для каждой категории считалось количество человек в обоих классах. На оси ординат обозначена доля гуманитариев в группе. Вертикальной полосой обозначен доверительный интервал. По графику видно, что технари чаще указывают у себя в профиле позитивное отношение к алкоголю. Очень негативное отношение чаще указывают гуманитарии.

Отношение к курению

В отношении к курению видна противоположная ситуация. Пользователи из класса «гуманитарий» чаще указывают позитивное отношение к курению. Видно, что не все значения отличаются от статистически значимых (некоторые доверительные интервалы включают значение 0.5, значит нельзя заявлять о различии), но тенденция все равно интересная.

Семейное положение и главное в жизни

По признаку «семейное положение» сильный перекос есть только в двух: «всё сложно» и «в активном поиске». Они оба смещены в сторону «гуманитарий».

По признаку «главное в жизни» — значимое отклонение есть только по одному — «красота и искусство», — и оно в сторону класса «гуманитарий».

Время активности

Построим распределение активности пользователей в разное время суток.

По графику видно, что в ночные часы (с 11 до 2) количество комментариев от класса «технарь» значительно больше. Это говорит о более «ночном» образе жизни пользователей этого класса. Также видно, что наименьшая активность наблюдается в 5-6 часов утра. Тем не менее, начиная с 4-х часов утра, количество комментариев от пользователей класса «гуманитарий» значительно больше, что говорит о более раннем времени подъема.

Примеры комментариев

Перед дальнейшим анализом можно посмотреть сами комментарии. Далее представлены несколько примеров из обеих групп.

Класс «технарь»: «Антон, ты когда-нить на заблокированных колесах останавливался? Какой тормозной путь получается?», «поддержим своих, конечно ) 21-го на Труде )», «Первое фото очень оригинально и весьма красиво!».

Класс «гуманитарий»: «Очень симпотичные котятки’, ‘=)))», «По — моему, делается всё для того, чтобы дети знали, как можно больше о наркотиках.», «я не успеваю за скоростью твоей мысли))))я безнадежен».

Видно, что комментарии написаны на разные темы. Можно постараться найти различия в затрагиваемых тематиках. Слова нужно будет привести к начальной форме, чтобы избежать множества похожих слов, одинаковых по смыслу. Возможно даже простое выделение используемых слов сможет хорошо разделять два класса. Также большое внимание нужно уделить используемым смайлам, эмодзи и пунктуации.

Предобработка данных

Первоначально необходимо удалить из выборки слишком длинные и слишком короткие комментарии. Они могут помешать обобщать моделям. Максимальная длина была ограничена 50-ю словами, а минимальная – 3-мя словами. Далее необходимо избавиться от спама. Сначала были удалены все комментарии, которые включали в себя ссылки на сторонние сайты, их оказалось менее 1%. Затем были удалены сообщения, которые повторялись более 2х раз, а значит были спамом, тоже менее 1%.

В данных было очень много обращений. В комментариях можно обращаться к определённому человеку через ссылку на его страницу. При скачивание через API имена заменяются на id страницы пользователя. Чтобы не засорять модель информацией об id, а также не допустить запоминания конкретных личностей, все обращения были удалены.

Генерация признаков

После анализа и очистки данных в задачах машинного обучения начинается этап построения и отбора признаков. Полезность финальной модели напрямую зависит от количества и качества полученных признаков.

Прежде чем начать работу с текстом, его нужно токенизировать, то есть разбить на слова. Это можно сделать с помощью стемминга или лемматизации. Стемминг – это выделение основы слова, откидывание окончания. Например, слова: “демократия”, «демократический», “демократизация” приводятся к слову «демокр». Лемматизация – это приведение слова к начальной форме. Все три слова из предыдущего примера приводятся к слову “демократия”. В данной задаче лучше сработала лемматизация, выполненная с помощью библиотеки pyMorphy2.

Векторизация текста

Необходимо комментарии трансформировать в векторы, потому что большинство моделей машинного обучения принимают на вход численные векторы. Самый простой подход называется мешок слов: он считает количество вхождений в текст каждого из слов. Перед тем, как получать векторы таким способом, необходимо избавиться от стоп-слов. Это такие слова, которые встречаются очень часто и не несут смысловой нагрузки, например, «иначе», «это», «или» и так далее.

При таком подходе не учитывается порядок слов в предложение. Фразы «не черный кот» и «кот черный не» будут преобразованы к одинаковому вектору, потому что в них одинаковый набор слов. Чтобы решить эту проблему, можно использовать идущие подряд токены – N-граммы.

Такие же векторы признаков можно строить и на уровне символов. Текст разбивается на N-граммы символов, где N обычно берется равное трем. Слово «лесной» разобьётся на: «лес», «есн», «сно», «ной». Этот подход имеет большое преимущество: он более устойчив к новым словам, которых не было в обучающей выборке.

Также для векторизации текста использовался Tf-Idf. Это статистическая мера, используемая для оценки важности слова в контексте документа, являющегося частью коллекции документов или корпуса. Большой вес получают слова с высокой частотой в пределах конкретного документа и с низкой частотой употреблений в других документах. Более подробно на хабре, например здесь.

Читайте также:  Режим полета на ноутбуке как отключить

Последняя опробованная модель векторизации — word2vec. Векторное представление основывается на контекстной близости: слова, встречающиеся в тексте с одним контекстом, в векторном представлении будут иметь близкие координаты. В интернете можно найти уже обученные на больших корпусах модели, которые сопоставляют слову его вектор. Отличные примеры работы word2veс на хабре.

Другие признаки

Другими источниками признаков стали общие характеристики комментария. Они описывают комментарий в целом.

Пунктуационные признаки:

  • наличие прямой речи;
  • количество запятых, знаков вопроса, восклицательных знаков, многоточий;
  • количество смайлов вида «)», «))», «((».

Признаки содержания:

  • процент слов, написанных CapsLock-ом;
  • процент английских слов;
  • наличие большой буквы в начале предложения.

Общие признаки:

  • количество слов;
  • количество предложений;
  • средняя длина слова;
  • средняя длина предложения.

Процесс получения предсказаний

Получив вектор признаков, перейдем к обучению моделей. Использование ансамбля нескольких моделей вместо одной предпочтительнее, так как это повышает точность и уменьшает дисперсию предсказаний. Строится несколько моделей, затем они опрашиваются по каждому объекту, который нужно классифицировать, и победитель выбирается по большинству голосов, — принцип простого голосования.

Пользователи были разделены на две части в пропорции 80 к 20. На первой проводилось обучение моделей, на второй – тестирование. Так как классы были сбалансированы, то за метрику была взята точность (accuracy) – это отношение числа верно классифицированных примеров к общему количеству примеров.

Итоговая задача – классифицировать пользователей, но так как классификация осуществляется по текстовым комментариям, то модели будут классифицировать каждый комментарий по отдельности. Чтобы сделать предсказание для пользователя, будем выдавать наиболее частый класс, предсказываемый для его комментариев ансамблем моделей.
Каждая модель будет обучаться на своем подмножестве признаков. Таким образом, модели получаются более устойчивы к выбросам, их предсказания становятся менее коррелированы, и ошибка обобщения (generalization error) минимальна.

Используемые модели

Линейная регрессия – модель, которая линейно взвешивает входные признаки. Линейные модели хорошо подходят для задач с большим количеством разреженных признаков, а векторное представление текста как раз таким и является. Также можно интерпретировать веса перед признаками. Например в случае векторизации с помощью мешка слов, положительный вес перед словом означает, что вероятность принадлежности к первому классу больше.

Многослойная нейронная сеть – модель, которая состоит из нескольких слоев с нейронами. Благодаря неоднократному применению функции активации, нейронная сеть представляет собой нелинейную функцию, что позволяет, теоретически, захватывать более сложные зависимости в данных.

Рекуррентная нейронная сеть – вид нейронной сети, который был специально создан для моделирования и анализа последовательностей (например, слов или символов). С помощью такой модели получается учитывать не только наличие конкретных признаков, но и их порядок.

Предсказания нейронных сетей намного сложнее интерпретировать. Чтобы получить хорошие результаты, нужно перебрать множество гиперпараметров: количество нейронов, количество слоев, величину регуляризации и другие. Для обучения нейронных сетей использовался фреймворк Keras. Более подробно о нейронных сетях можно почитать в серии статей на хабре.

Три модели, которые были перечислены выше, принимают на вход комментарии с различными вариантами векторизации: мешок слов, Tf-Idf, word2vec. Техника мешка слов применялась как на на уровне слов, так и на уровне символов. Как было сказано выше, чем больше разных моделей, тем лучше, поэтому были отобраны несколько вариантов одних и тех же моделей с различными гиперпараметрами.

Последняя модель – градиентный бустинг деревьев. Этот алгоритм показывает хорошие результаты в случае работы с количественными и категориальными признаками. В отличие от предыдущих моделей, она обучалась на общих характеристиках комментария (количество запятых, средняя длина слова и других статистиках). Использовалась библиотека XGBoost.

С помощью валидации были выбраны модели, которые показывали лучшее качество на уровне пользователей. Они и вошли в финальный ансамбль. Также была проанализирована корреляция между предсказаниями моделей.

Можно заметить, что сильнее всего отличались предсказания моделей градиентного бустинга (xgb) и рекуррентной сети на уровне символов (lstm_char). Строка prediction — ансамбль всех моделей.

Модели выбирались в ансамбль не только по точности, но и по некоррелированности предсказаний. Если две модели имеют одинаковую точность и очень похожи, — толку от их усреднения не будет.

Результаты

Качество финальной модели зависит от минимального количества комментариев, которое будет использоваться для классификации одного пользователя. В теории, чем больше комментариев, тем лучше.

Однако при увеличении минимального количества комментариев от одного человека, уменьшается число человек, имеющих данное или большее кол-во комментариев, т.е. уменьшается размер обучающей выборки. Например, 2 и более комментария имеют примерно 4000 человек, а 10 и более комментариев – менее 1000. Этим объясняется снижение точности классификации при увеличении количества комментариев одного пользователя до 11-ти и больших значениях.

Наилучшая точность, равная 0.66, достигается при использование 11 комментариев от одного человека. Этого результата недостаточно, чтобы говорить об успешном решении поставленной задачи классификации, но все же эта точность превосходит качество предсказаний с помощью бросания монетки. В дальнейшем результаты можно улучшить путем сбора большего количества данных.

Наиболее важными для модели градиентного бустинга, не использующей непосредственно слова комментариев, оказались следующие признаки:

  • средняя длина слова;
  • количество слов;
  • доля английских слов в комментарии;
  • использование восклицательного знака.

С помощью библиотеки eli5 визуализируем предсказания линейной модели, работающей поверх представления текста в виде мешка слов:

На уровне символов:

Зеленым подсвечены слова и символы, которые вносят максимальный вклад в предсказанный класс, а красным которые вносят вклад в противоположный класс. y = 1 означает, что модель предсказывает класс гуманитарий, y = 0 — технарь.

Веб-сервис

Для демонстрации работы я развернул модель в качестве веб-сервиса. В качестве бэкенда был использован Flask, простой дизайн сделан с помощью Bootstrap, а для хостинга был взят Heroku. Попробовать на себе можно по адресу www.commentsanalysis.ru.

Важным ограничением стало время формирования одного предсказания. Из-за этого было решено оставить лишь 5 лучших линейных моделей для ансамбля.

На сайте четыре основных блока: краткая инструкция, поле со случайным комментарием, поле для ввода комментария пользователя и поле с результатом классификации. После того, как будет введено не менее 5 комментариев, результат может быть предсказан.

Теперь, когда система разработана и запущена, можно подумать об ее применении. Например, студентов-гуманитариев, учащихся на технических факультетах, можно автоматически переводить на более подходящие им факультеты.

P.S: огромное спасибо olferuk за правку текста.

Only registered users can participate in poll. Log in, please.

Ссылка на основную публикацию
Создать новую электронную почту на яндексе бесплатно
Всем привет! С вами снова я, Алексей. В этом посте я расскажу вам о том, как создать электронную почту на...
Сколько человек сидит в одноклассниках
Mail.Ru Group исследовала и сравнила аудитории самых популярных в России социальных сетей — «Одноклассники», «Мой Мир», «ВКонтакте», Facebook и Twitter....
Сколько четырехзначных чисел можно составить из нечетных
Условие Решение 1 Решение 2 Решение 3 Поиск в решебнике Популярные решебники Издатель: Н. Я. Виленкин, В. И. Жохов, А....
Создать канал на ютубе регистрация бесплатно
Добрый день, уважаемые читатели и гости моего блога! Если вы попали на эту статью, значит хотите узнать, как зарегистрироваться в...
Adblock detector