|
Карен Прайор
Содержание
ПРЕДИСЛОВИЕ
ПОДКРЕПЛЕНИЕ: ЛУЧШЕ, ЧЕМ ВОЗНАГРАЖДЕНИЕ
ПРОЦЕСС ВЫРАБОТКИ: ФОРМИРОВАНИЕ ВЫСШИХ ФОРМ ПОВЕДЕНИЯ БЕЗ ПРИНУЖДЕНИЯ И БОЛИ
УПРАВЛЕНИЕ С ПОМОЩЬЮ СТИМУЛОВ.
ОТУЧЕНИЕ: КАК ИСПОЛЬЗОВАТЬ ПОДКРЕПЛЕНИЕ, ЧТОБЫ ИЗБАВИТЬСЯ ОТ НЕЖЕЛАТЕЛЬНОГО ПОВЕДЕНИЯ
ПОДКРЕПЛЕНИЕ В ПОВСЕДНЕВНОЙ ЖИЗНИ
Предисловие автора
Эта книга о том, как обучать кого угодно: человека или животное, старого или молодого, самого себя или других - и чему угодно. Как добиться, чтобы кот спрыгнул с кухонного стола, а бабушка перестала ворчать; как управлять поведением домашних животных, детей, начальства и друзей; как улучшить свои достижения в теннисе, гольфе, математике, развить память? Все это можно достичь, используя принципы обучения с подкреплением. Эти принципы являются такими же непреложными законами природы, как законы физики. Они лежат в основе всех ситуаций обучения, точно так же, как падение яблока основано на законах гравитации. При попытке изменить чье-либо поведение, будь то собственное или чужое, мы используем эти законы, независимо от того, знаем мы их или нет. Чаще всего мы их применяем неправильно. Мы запугиваем, спорим, принуждаем, лишаем чего-либо. Мы ругаем окружающих, когда дела идут плохо, и забываем похвалить, когда все хорошо. Мы грубы и нетерпеливы с детьми, друг с другом, даже сами с собой, и потом сожалеем об этой грубости. Зная лучшие способы управления поведением, мы достигли бы своей цели быстрее, к тому же без нервотрепки, но мы не представляем, как это сделать. Мы попросту не можем привести в соответствие те приемы, которыми современные дрессировщики достигают успеха, с законами положительного подкрепления. Какой бы ни была наша задача - заставить ли четырехлетнего малыша вести себя тихо при посторонних, отучить ли щенка грызть дома все что попало, тренировать ли спортивную команду, выучить ли стихотворение - она решается быстрее, легче, веселее, если вы знаете, как пользоваться положительным подкреплением.
Законы подкрепления просты: их можно за десять минут записать на школьной доске и за час выучить. Применение их в основном зависит от ситуации, обучение с подкреплением подобно игре, в которой надо быстро соображать. Каждый может быть тренером, но некоторые от природы способны к этому больше, чем другие. Вам вовсе не обязательно отличаться каким-то особым терпением, быть сильной личностью, не требуется и особого подхода к детям и животным, можно не обладать и тем, что цирковой дрессировщик Франк Бук называет силой человеческого взгляда. Вам надо только знать, что вы делаете. Всегда были люди с интуитивным пониманием того, как применять законы дрессировки. Мы называем их талантливыми учителями, блестящими военачальниками, выдающимися тренерами, гениальными дрессировщиками. Мне приходилось наблюдать за некоторыми театральными режиссерами и многими дирижерами симфонических оркестров, которые очень умело использовали в своей работе подкрепление. Эти одаренные воспитатели не нуждаются в книге о том, как использовать законы, управляющие обучением. Однако для всех нас остальных - простых смертных, - кто вслепую пытается совладать с плохо управляемым питомцем, вступает в конфликт с ребенком или сослуживцем, знание законов подкрепления может сослужить хорошую службу.
Обучение с подкреплением - это вовсе не система наград и наказаний; современные тренеры даже не используют этих терминов. Награды и наказания приходят обычно после того, как действие совершено, часто спустя длительное время, как, например, в уголовном суде. Они могут повлиять, а могут и не повлиять на будущее поведение, но они, безусловно, не могут воздействовать на уже совершенное действие. Подкрепление - будь то "положительное", то, к чему надо стремиться, например, улыбка или ласка, или "отрицательное" - то, чего надо избегать, подобно рывку поводка или нахмуренным бровям - происходит именно во время поведения, на которое надо воздействовать. Подкрепление изменяет поведение только тогда, когда дается в правильно выбранный момент.
Впервые я услышала об обучении с положительным подкреплением на Гавайях, куда в 1963 году я была приглашена старшим тренером дельфинария "Жизнь моря". Раньше я дрессировала собак и лошадей, пользуясь традиционными методами, но дельфины - другое дело; на животное, которое просто уплывает от тебя, не воздействуешь поводком, уздечкой или даже кулаком. Положительное подкрепление - в основном ведро с рыбой - единственное, чем мы располагаем. Психологи в общих чертах познакомили меня с принципами обучения с подкреплением. Искусство применения этих принципов я постигла при работе с дельфинами. Имея биологическое образование и всю жизнь интересуясь поведением животных, я оказалась очарованной не столько дельфинами, сколько моим с ними взаимным общением во время дрессировки. То, чему я обучилась, работая с дельфинами, я стала применять и в дрессировке других животных. И я начала замечать, как эта система входит в мою повседневную жизнь. Например, я перестала кричать на своих детей, потому что заметила, что крик не помогает. Подмечать поведение, которое мне нужно, и сразу подкреплять его - это гораздо более действенно, да к тому же еще и сохраняет мирные отношения в семье. Тот опыт, который я извлекла из дрессировки дельфинов, имеет солидное теоретическое обоснование. В этой книге я постаралась держаться подальше от теоретизирования, так как, насколько мне известно, правила по применению этих теорий обычно не описываются наукой и, с моей точки зрения, ученые часто неправильно ими пользуются. Но основные законы уже твердо установлены и должны приниматься во внимание при обучении. Основа этой теории по разным источникам известна как модификация поведения, теория подкрепления, оперантное обусловливание, бихевиоризм, психология поведения и т.д.; это тот раздел психологии, который принес мировую известность Б.Ф.Скиннеру, профессору Гарвардского университета. Я не знаю другой современной области науки, которую бы в такой степени поносили, не понимали, переиначивали, неправильно истолковывали и неверно использовали. Одно только имя Скиннера приводит в ярость тех, кто является поборником "свободной воли" в качестве характеристики, отделяющей человека от животного. Для тех, кто воспитан в гуманистических традициях, воздействие на поведение человека при помощи своего рода осознанной техники кажется непоправимо безнравственным, несмотря на тот очевидный факт, что все мы пытаемся влиять на поведение друг друга любыми попавшимися под руку средствами. Пока гуманисты нападали на бихевиоризм и самого Скиннера с таким же жаром, с каким когда-то правоверные обрушивались на еретиков, бихевиоризм превратился в громадный раздал психологии, которым занимаются целые факультеты в университетах, он широко применяется в клинике, бихевиористы издают специальные журналы и созывают международные конгрессы бихевиоризму обучают на специальных курсах, в нем возникает ряд доктрин и разных течений, ему посвящаются целые горы литературы. Это принесло определенную пользу обществу. Некоторые болезни - например, аутизм - оказались более чувствительны к формированию и подкреплению, чем к любым другим воздействиям. Многие врачи успешно разрешали эмоциональные проблемы своих пациентов, используя приемы бихевиоризма. Большая эффективность простого изменения поведения по сравнению со скорпулезным копанием в источниках его происхождения - по крайней мере в некоторых обстоятельствах - способствовала возникновению семейной терапии, в которой рассматривается поведение каждого "иена семьи, а не только того, чье страдание наиболее очевидно. Обучающие машины и программированные учебники, разработанные на основе Скиниероаской теории, были первыми попытками разбить обучение на этапы и поощрять обучающегося за правильные ответы. Эти ранние механизмы были неуклюжими, но именно они были предвестниками компьютерного обучения, которое оказалось не только высокоэффективным, благодаря совершенству выбора времени подкрепления компьютером, но и висело в процесс обучения веселые нотки в связи с забавным характером подкрепления (фейерверки, танцующие роботы). Программы подкрепления, использующие жетоны и талоны, которые можно накопить и обменять на конфеты, сигареты или какие-то льготы, были установлены в психиатрических лечебницах и некоторых других учреждениях. Нет недостатка в программах аутотренинга, позволяющих следить за весом и изменением других привычек в нужную сторону, и все они основаны на положительном подкреплении. Интересным применением подкрепления для тренировки физиологических реакций является биологическая обратная связь. Академические ученые изучили мельчайшие аспекты обуславливания. Например, одно исследование показывает, что если вы составляете таблицу, чтобы следить за своими успехами в выполнении какой-либо саморазвивающей программы, то вы скорее выработаете новые привычки, если будете ежедневно не ставить в клеточке соответствующей графы крестик, а сплошь ее зачеркивать. Обрастание деталями преследует конкретные психологические цели, но я не смогла извлечь из них большой пользы для обучения. Тренинг представляет собой петлю, двустороннюю связь, в которой события на одном конце изменяют события на другом, точно так же, как это происходит в кибернетической системе с обратной связью, хотя многие психологи рассматривают свою работу, как нечто, что они дела ют по отношению к субъекту, а не совместно с ним. Для настоящего тренера наиболее интересными и потенциально наиболее плодотворными событиями в процессе обучения являются идеосинкразические и неожиданные ответы, которые может дать каждый испытуемый, хотя почти во всех научных работах стремятся игнорировать и свести к минимуму индивидуальные реакции. Изобретение методов, которые Скиннер назвал "формирование" для последовательного изменения поведения и реализация этих методов -- процесс творческий. Несмотря на это, психологическая литература изобилует программами формирования, которые Настолько невообразимы, чтобы не сказать неуклюжи, что, с моей точки зрения, представляют собой жестокое и необычное наказание. Возьмем, например, приводимый в одном из последних научных журналов метод борьбы с ночным самопроизвольным мочеиспусканием, который включает не только установку специальных датчиков влажности в детской постели, но и присутствие врача, проводящего ночь рядом с ребенком! При этом авторы указывают, что этот способ дорого обходится семье. А какова же его цена для психики ребенка? Такой способ "поведенческого" решения вопроса подобен попытке бить мух лопатой. Прежде чем двигаться дальше, я должна извиниться перед всеми профессиональными бихевиористами, которые обеспокоены моим лихим использованием терминологии теории подкрепления. Словарь Скиннера имеет несколько элегантных определений, таких, как оперантное обучение, которое подчеркивает, что субъект является оператором, а не только пассивным участником, или последовательное приближение, предполагающее постепенный характер процедуры формирования навыков. Однако, обучая тренингу, я обнаружила, что люди спотыкаются об эту непривычную терминологию. Чтобы четко изложить предмет, вы должны обучить двум вещам; самой сущности работы и подходящему способу ее обсуждения. По мере распространения из университета в университет Скиннеровская терминология подверглась некоторой модификации; то, что одни называют условными стимулами, другие предпочитают именовать различительными стимулами, а третьи употребляют жаргонное выражение "S-дельта". Этот специфический словарь все время разрастается. Поэтому я пожертвовала научной точностью ради такой терминологии, которая, как мне кажется будет понятной. Шопенгауэр сказал однажды, что каждая оригинальная идея сначала осмеивается, потом на нее яростно нападают, и, наконец, она принимается как нечто само собой разумеющееся. Насколько мне известно, теория подкрепления не является исключением. Несколько лет назад Скиннера повсюду высмеивали за то, что он продемонстрировал формирование навыка, обучив пару голубей играть в пинг-понг. Теплая, комфортабельная, самоочищающаяся, полная забав комната, которую он оборудовал для своих маленьких дочерей, была высмеяна, как антигуманный, аморальный и еретический "ящик для ребенка", чуть ли не тюремная камера. До сих пор ходят слухи, что его дочери сошли с ума, хотя на самом деле они выросли прекрасными работниками и очень славными людьми. И, наконец, сейчас многие образованные люди относятся к теории подкрепления как к некому пустяку, который они понимают и знают вдоль и поперек. Фактически же большинство людей ее не понимает, иначе бы они не вели себя так скверно с окружающими. В течение многих лет, с тех пор, как я начала заниматься экспериментами по тренировке дельфинов, я читала лекции и писала о правилах подкрепления для научных и профессиональных кругов, а также для широкой публики. Я обучала этому виду тренинга в высшей школе и в колледжах, я работала с выпускниками университетов, домохозяйками и служителями зоопарков, с членами моей семьи и друзьями. Я наблюдала и изучала работу дрессировщиков всех возможных типов: от ковбоев до спортивных тренеров, - и заметила, что принципы подкрепляемого обучения постепенно проникают повсюду. Голливудские дрессировщики животных называют использование метода позитивного подкрепления "аффективной тренировкой" и используют эту технику, чтобы вырабатывать такие типы поведения, которых нельзя добиться силой - например, как в рекламном телеролике, где бык спокойно прогуливается по китайской лавке. Сегодня многие спортивные тренеры используют позитивное подкрепление и формирование, а не полагаются на старинный метод кнута, и при этом результаты их воспитанников значительно улучшаются. Однако нигде я не обнаружила правил теории подкрепления, описанных таким образом, чтобы ими можно было непосредственно пользоваться на практике. В этой книге я объясняю эти правила так, как я их понимаю, а также поясняю, где я считаю нужным их применять, а где, по-моему мнению, это невозможно и нецелесообразно. Тренировка с подкреплением не разрешает всех проблем - она не увеличит ваш счет в банке, не спасет от неудачной женитьбы, не поможет в случаях тяжелых заболеваний психики. Некоторые ситуации, например, плач ребенка, не имеет отношения к проблеме тренировки и требуют других методов разрешения. Некоторые типы поведения человека и животных имеют генетические компоненты, которые трудно или невозможно изменить тренировкой. Ряд проблем просто не стоит того, чтобы тратить время на тренировку. Но во многих случаях, когда жизнь бросает человеку вызов, ставит задачи и посылает неприятности, правильное использование подкрепления может оказаться полезным. Практическое использование позитивного подкрепления в одной ситуации может побудить вас использовать его и в других. Как раздраженно сказал один исследователь дельфинов, с которым я работала: "Человеку нельзя разрешать заводить детей, прежде чем он не сумеет обучить цыпленка", подразумевая, что опыт достижения результатов в обучении существа, к которому невозможно применить силу, должен показать вам, что для воспитания ребенка вы так же не нуждаетесь в применении силы. Я заметила, что у большинства дельфиньих тренеров, использующих навыки позитивного подкрепления в своей ежедневной работе, чрезвычайно милые и приятные дети. Эта книга не обеспечит вам милых детей. И она не обещает дать вам какие-либо специфические результаты или навыки. Что она даст вам, так это фундаментальные принципы, лежащие в основе любого обучения, и некоторые основные установки творческого применения этих принципов в различных ситуациях. Другими словами она даст вам искусство тренировки. Она может помочь вам преодолеть те неприятности, которые беспокоили вас в течение многих лет, или достичь успехов в трудных для вас делах. Она, конечно, поможет вам, если вы того пожелаете, и обучить цыпленка.
В теории подкрепления, по-видимому, существует естественный порядок, и в книге главы идут в той последовательности, в которой происходят процессы тренировки, от простого к сложному, как при реальном обучении, и это та самая последовательность, при которой наиболее легко овладеть профессией тренера. Книга построена таким образом, чтобы постепенно складывалось разумное понимание процесса тренировки при помощи позитивного подкрепления. Однако, так как эта теория широко применяется на практике, то в пяти главах книги в качестве примеров приводятся различные жизненные ситуации, в которых позитивное подкрепление играет положительную роль.
I. ПОДКРЕПЛЕНИЕ: ЛУЧШЕ, ЧЕМ ВОЗНАГРАЖДЕНИЕ
Что такое положительное подкрепление?
Положительное подкрепление - это событие, совпадающее с каким-либо действием и ведущее к увеличению вероятности повторного совершения этого действия.
Запомните это положение. В нем заложен секрет успешного обучения.
Существуют два вида подкрепления: положительное и отрицательное. Положительное подкрепление - это нечто, желаемое субъектом: пища, ласка или похвала. Негативное подкрепление - это то, чего субъект хотел бы избежать: шлепок, нахмуривание бровей, неприятный звук (предупреждающий зуммер в машинах, который раздается, если вы забыли пристегнуть ремень безопасности, - это отрицательное подкрепление).
Поведение, которое уже встречается вне зависимости от того, насколько оно спорадично, всегда можно усилить с помощью положительного подкрепления. Если вы зовете щенка, и он подходит к вам, а вы его ласкаете, то в дальнейшем подход щенка на зов становится все более и более надежным даже безо всякого другого обучения. Предположим, что вы хотите, чтобы кто-то позвонил вам - ваш отпрыск, родитель или любимый. Если он или она не звонит, то тогда уж ничего не поделаешь. Самое главное в обучении с подкреплением то, что вы не можете подкрепить поведение, которое не встречается. С другой стороны, если вы всегда проявляете радость, когда любимые вам звонят, то это значит что их поведение положительно подкрепляется, вероятность частоты их звонков, очевидно, увеличится. Конечно, если вы примените отрицательное подкрепление - "Почему ты не позвонил, почему я должна тебе звонить, ты мне никогда не звонишь" и т.д., замечания, которые вызывают раздражение, - вы создаете ситуацию, при которой звонящий избегает неприятностей тем, что не звонит; фактически вы обучаете их не звонить. Простое введение положительного подкрепления за поведение является наиболее элементарной частью этого вида обучения. В научной психологической литературе встречаются такие выражения: "Были использованы поведенческие методики" или "Проблема была решена с помощью поведенческого подхода". Обыкновенно это означает, что они отдают предпочтение положительному подкреплению перед другими использованными ими методами. Это совсем не означает, что они использовали весь арсенал приемов, описанных в этой книге; они могут и не знать о них. Однако введение положительного подкрепления часто является единственно необходимым мероприятием. Кстати, например, наиболее действенный способ приучить ребенка не мочиться в постель - лично похвалить его и выразить свое удовольствие, если утром простынки оказались сухими. Положительное подкрепление можно применить и к себе. В Шекспировской студии, которую я в свое время посещала, я встретила юриста с Уолл-стрит, которому было под пятьдесят и который был страстным любителем игры в сквош (игра, в которую играют ракетками и мягким мячом в закрытых кортах). Однажды он услышал, как я рассказываю об обучении, и уходя заметил, что можно испробовать положительное подкрепление на его игре в сквош. Вместо того что бы как обычно сокрушаться об ошибках, он попробует вознаграждать себя за хорошие удары. Через две недели я снова встретила его. "Как сквош?" - спросила я. На его лице потаилось выражение заинтересованности и радости, что нечасто бывает с юристами с Уолл-стрит. "Сначала я чувствовал себя жутким дураком, - ответил он, - говоря: "Хорошо, Пит, молодец!" при каждом удачном ударе. Черт возьми, когда я тренировался один, я даже поглаживал себя по спине. Но затем моя игра начала улучшаться. И сейчас я на четыре ранга выше в клубной лестнице, чем был когда-либо раньше. Я побеждаю тех, у которых прежде не мог выиграть даже очко. И получаю гораздо больше удовольствия. С тех пор как я не ору на себя все время, я не кончаю игру злым и разочарованным. Если удар не получился, ничего страшного, следующие будут хорошими. И я обнаруживаю, что мне просто смешно, когда кто-нибудь другой делает ошибку, бесится, бросает ракетку - я знаю, что это не улучшит его игру, я только улыбаюсь. Какой жестокий противник. И это сразу же как только перешел на положительное подкрепление. Подкрепление относительно, не абсолютно. Дождь является положительным подкреплением для уток, отрицательным для кошек, довольно безразличен, по крайней мере во влажную погоду, для коров. Пища не является положительным подкреплением, если вы сыты. Улыбки и похвалы могут быть непригодными в качестве подкрепления, если субъект хочет вывести вас из себя. В качестве подкрепления надо выбирать нечто желаемое субъектом. Для любой тренировочной ситуации полезно иметь набор подкреплений. В океанариумах "Жизнь моря" косаток подкрепляют множеством способов: рыбой (их пища), поглаживанием или почесыванием различных частей тела, вниманием окружающих, игрушками и т.д. Все представления - это действия, при которых животное никогда не знает, какое поведение будет подкреплено в следующий раз и каким будет подкрепление; эти "сюрпризы" так интересны для животных, что представления могут идти почти без стандартных подкреплений рыбой; животные получают пищу в конце дня. Необходимость постоянного перехода от одного подкрепления к другому увлекательна и интересна и для тренеров. Положительное подкрепление приносит пользу и при взаимоотношениях между людьми. Оно лежит в основе искусства делать подарки: точно угадать, что будет иметь подкрепляющее действие (правильный выбор является подкреплением и для делающего подарок). У нас чаще всего принято доверять выбор подарков женщинам. Я даже знаю одну семью, в которой мать покупает рождественские подарки всем и ото всех. И очень забавно, когда рождественским утром братья и сестры говорят: "Смотрите, это Биллу от Энни", хотя все знают, что Энни тут ни при чем. Но это не совершенствует у детей навыка выбирать способы поощрения других. В нашем мире человек, выработавший в себе наблюдательность в отношении положительного подкрепления, имеет большие преимущества перед другими. Как мать, я сделала все, чтоб мои сыновья научились делать подарки. Например, однажды, когда они были еще маленькими - семь и пять лет, я повела их в довольно фешенебельный магазин и предложила каждому выбрать по платью для их младшей сестренки. Им понравилось, развалясь в плюшевых креслах, одобрять или не одобрять платья, которые она примеряла, как нравится какому-нибудь миллионеру помогать своей подружке выбирать норковую шубку. Их маленькая сестренка тоже получила удовольствие. Так, благодаря этому и подобным упражнениям, урок был усвоен: как по-настоящему проникнуться интересом к тому, что хочет другой человек, как находить радость в поисках положительного подкрепления для тех, кого любишь.
Отрицательное подкрепление
Психологи спорят по поводу определения отрицательного подкрепления. Для наших целей отрицательное подкрепление можно определить как то, что субъект будет стараться избегать. Отрицательные подкрепления имеют градации от слегка неприятных стимулов - едва заметный сквозняк от кондиционера в ресторане, который все-таки заставляет вас перейти за другой столик, - до всевозможных крайностей, например удара электрическим током. Наказание происходит после поведения, на которое оно должно воздействовать. Таким образом, вы не можете избежать наказания, изменив взгляды или поступки, так как неправильное поведение уже осуществилось. Малыш, которого отшлепали за плохой табель успеваемости, может в дальнейшем учиться лучше или хуже, но уже не сможет изменить того табеля, который он уже принес. Напротив, отрицательное подкрепление можно остановить или избегнуть сиюминутным изменением поведения. Допустим, сидя в гостиной у тетушки, я случайно положила ноги на кофейный столик. Тетушка неодобрительно поднимает брови. Я ставлю ноги на пол. Ее лицо мягчеет. Я чувствую облегчение. И поскольку я смогла остановить сигнал нерасположенности, совершившееся поведение было подкреплено. Я усвоила: в тетушкином доме держи ноги по дальше от мебели. Поведение может быть полностью сформировано на основе отрицательного подкрепления, как в большинстве случаев традиционной дрессировки животных: лошадь учится поворачивать налево, когда тянут за левый повод, потому что поворот прекращает неприятное давление; лев вспрыгивает на тумбу, чтобы избежать назойливого хлыста или острой палки, которые держат около его морды.
В общем, термин "подкрепление" в этой книге относится к положительному подкреплению; если я захочу обсудить отрицательное подкреняение, я оговорю это особо. Вообще же оба вида подкрепления подчиняются одинаковым правилам применения. Например, ошибка во времени подачи подкрепления не даст результатов (или результаты будут плохими) при использовании как одного, так и другого метода подкрепления.
Время подачи подкрепления Как уже говорилось, подкрепление должно совершаться в связи с действием, которое предполагается видоизменить. Подкрепление - это информация. Оно говорит субъекту, что именно вам нравится. Когда субъект пытается обучиться, информационное содержание подкрепления становится важнее самого подкрепления. В тренировке спортсменов или при обучении танцоров именно восклицания инструктора "Да!" или "Хорошо!", отмечающие нужное движение, а не разбор тренировки или репетиции в раздевалке дают требующуюся информацию. Запоздалое подкрепление является наибольшим недочетом начинающего дрессировщика. Собака садится, но к тому времени, когда хозяин говорит: "Хорошая собака", собака уже снова стоит. За что, думает животное, его хвалят? За то, что оно встает. Если у вас возникают трудности в дрессировке, первый вопрос, который надо себе задать, не запаздывает ли ваше подкрепление. Если вы при работе с животным вдруг застряли в самый разгар дела, то иногда полезно, чтоб кто-нибудь со стороны понаблюдал за запаздыванием подкреплений.
Мы всегда слишком запаздываем подкрепляя друг друга. "Послушай, дорогая, вчера вечером ты выглядела замечательно", - звучит совсем не так, как та же фраза, сказанная вовремя. Отсрочка подкрепления может даже оказать вреднее воздействие ("А что, разве я сейчас не выгляжу замечательно?"). Мы свято верим, что сила слов перекроет ошибки во времени подкрепления. Слишком раннее подкрепление тоже неэффективно. В зоопарке Бронкса служители замучились с гориллой. Им было нужно, чтобы она выходила в вольер, чтобы можно было почистить внутреннюю клетку, но она взяла манеру сидеть в дверном проеме, и, обладая недюжинной силой, не давала закрываться скользящей двери. Когда же служители клали пищу снаружи или подманивали ее бананами, горилла либо не обращала на них внимания, либо хватала пищу и бежала обратно к своей двери, прежде чем ту успевали закрыть. Дрессировщика, работавшего при зоопарке, попросили разобраться. Он объяснил служителям, что размахивание бананами и подбрасывание пищи было попыткой подкрепить действие, которое еще не совершилось. Это называется взяточничеством. Надо было не замечать животное, пока оно сидело в дверях, но подкреплять пищей, если оно выйдет оттуда самостоятельно. Проблема была решена.
Мне кажется, что иногда и детей мы подкрепляем слишком рано, находясь под ложным впечатлением, будто мы их подбадриваем ("Молодец, хорошо, ты уже почти все сделала правильно"). Возможно, при этом мы подкрепляем попытки. Но существует разница между попыткой сделать что-то и выполнением этого. Причитания типа "я не могу" иногда отражают фактическое положение вещей, но они могут являться и признаками того, что часто подкреплялись просто попытки. Вообще, подкрепление поведения, которое еще не совершилось, - подарками, обещаниями, комплиментами или чем-нибудь в этом роде - ни капельки не подкрепляет это поведение. Если что-то и подкрепляется, так это поведение, совершающееся в данное время: вероятнее всего - выпрашивание подкрепления. Соблюдение времени очень важно и при обучении с отрицательным подкреплением. Лошадь учится поворачивать налево, когда тянут за левый повод, но только если после поворота натяжение ослабевает. Прекращение натяжения является подкреплением. Вы садитесь на лошадь, пришпориваете ее, и она движется вперед - тогда вам надо перестать ее пришпоривать (если, конечно, вы не хотите, чтобы она двигалась быстрее). Начинающие наездники часто тычут лошадь в бока непрерывно, как будто шпоры это своего рода педаль газа в автомобиле, необходимая для движения. Пришпоривание не прекращается и тем самым не несет никакой информации для лошади. Так в школах верховой езды появляются лошади с железными боками, которые передвигаются черепашьим шагом независимо от того, как часто их пришпоривают.
То же происходит и с людьми, к которым постоянно придираются и бранят родители, начальство или учителя. Если отрицательное подкрепление не прекращается в момент достижения желаемых результатов, то оно не является подкреплением и не несет информации. Оно становится как буквально, так и в терминах теории информации "шумом".
Когда я смотрю по телевизору футбол или бейсбол, я всегда поражаюсь замечательной своевременности подкреплений, вновь и вновь получаемых игроками. Как только забивают гол или бегун пересекает финишную линию, рев толпы сигнализирует полное одобрение; а только посмотрите на бешеный обмен взаимоподкреплений игроков в тот момент, когда счет открыт или игра выиграна. С артистами, особенно с киноактерами, дело обстоит совершенно иначе. Даже на сцене аплодисменты раздаются после того, как работа кончается. У артистов кино не существует своевременного подкрепления, за исключением редкого отзыва режиссера или оператора об их работе или рукопожатия; письма поклонников и положительные рецензии, приходящие спустя недели и месяцы, бледнеют в сравнении с неистовством американского стадиона в минуту успеха. Нет ничего удивительного, что некоторые звезды кино проявляют болезненную страсть к низкой лести, и сенсациям; работа может совершенно не удовлетворять, если подкрепления, даже самые блестящие, всегда опаздывают.
Величина подкрепления.
Начинающие тренеры, использующие пищевое подкрепление при работе с животными, часто не знают, какова должна быть величина каждого подкрепления. Ответ таков: чем меньше, тем лучше. Чем меньше подкрепление, тем быстрее животное съест его. Это не только экономит время, но и позволяет дать большее количество подкреплений за один сеанс, прежде чем животное насытиться. В 1979 г. Национальный зоопарк в Вашингтоне, штат Колумбия, пригласил меня в качестве консультанта для обучения группы работников зоопарка технике положительного подкрепления. Одна из смотрительниц в моей группе жаловалась, что обучение панды продвигается у нее очень медленно. Мне показалось это странным, потому что интуитивно я чувствовала, что панды - эти большие, прожорливые, активные животные - должны легко поддаваться обучению с пищевым подкреплением. Я понаблюдала за ее занятиями и обнаружила, что, когда смотрительнице удавалось добиться какого-либо движения, она давала панде целую морковку. Панда долго смаковала каждую морковку, поэтому в течение пятнадцати минут отведенного ей драгоценного времени она зарабатывала только три подкрепления (а кроме того, морковь ей надоедала). Один ломтик моркови на подкрепление был бы лучше.
Вообще, подкрепление величиной в один глоток животного вполне достаточно для поддержания его заинтересованности - одно-два зернышка для цыпленка, кубик мяса в 6 мм для кошки, половина яблока для слона. Особо любимой пищи можно давать и еще меньше - например чайную ложку зерна для лошади. Служители Национального зоопарка обучали белых медведей многим полезным вещам, таким, как переход по команде в другую клетку, используя изюминки.
Основное правило дрессировщика заключается в том, что если вы собираетесь провести в день одно занятие, то можете рассчитывать на хорошую работу животного примерно за четверть его дневного рациона, остальное дается после окончания работы. Если же вам надо провести три или четыре занятия в день, то дневную порцию пищи надо разделить примерно на восемьдесят частей и за один сеанс давать двадцать или тридцать. Восемьдесят подкреплений, видимо, являются максимумом, способным заинтересовать субъекта в течение дня. (Может быть, поэтому слайдовая кассета содержит восемьдесят слайдов; по крайней мере, когда лектор просит демонстратора показать вторую кассету слайдов, я тяжело вздыхаю).
Размер подкрепления зависит также от сложности задачи. В океанариуме "Жизнь моря" мы сочли необходимым давать каждому [дельфину] по большой макрели за их олимпийские 6-7 метровые вертикальные прыжки. Они просто отказывались делать это за обычное вознаграждение в виде двух маленьких корюшек. У людей почти всегда более трудная работа вознаграждается лучше. А если этого нет, то как мы ненавидим тяжелую работу, если нам приходится ее делать.
Большой куш.
Одним из наиболее полезных приемов пищевого или какого-либо другого подкрепления для человека и животных является получение куша. Это награда, которая во много, иногда в 10 раз больше обыкновенного подкрепления и являющаяся сюрпризом для субъекта. В рекламном агентстве, где я когда-то работала, бывали официальные вечера на Рождество, а также неофициальные праздники по поводу окончания большой работы или заполучения нового клиента. Но у председателя правления была еще привычка устраивать в год один-два абсолютно неожиданных вечера. Внезапно в середине дня он проносился по всем комнатам конторы, крича, чтоб все кончали работу. Коммутаторы выключались, появлялась процессия поставщиков провизии, музыканты, буфетчики, шампанское, копченая семга, и все это только для нас и безо всякой особенной причины. Это было неожиданным кушем для пятидесяти человек. Я думаю, что это очень способствовало поднятию духа коллектива. Куш можно использовать и для того, чтоб отметить внезапное озарение. Один мой знакомый наездник, когда лошадь впервые проделывает какой-нибудь сложный маневр, соскакивает с нее, освобождает от седла и уздечки и свободно выпускает на манеж - куш полной свободы, который часто, по-видимому, может привести к образованию новой линии поведения. Как ни странно, получение всего одного куша может так же улучшить ответы непокорного, испуганного или сопротивляющегося субъекта, который вообще не проявлял нужного поведения. В океанариуме "Жизнь моря" мы проводили исследования по заданию ВМС США, в которых дельфин получал подкрепление за новые реакции, осуществляемые вместо старого, ранее выработанного поведения. Испытуемой была понятливая самочка по имени Хоу, которая редко давала новые ответы. Когда ей не стало удаваться получать подкрепления за свои действия, она стала неактивной, и в конце концов в течение одного занятия за двадцать минут не дала ни одного ответа. Наконец, тренер кинул ей пару рыбок "ни за что". Явно ошарашенная такой щедростью, Хоу снова стала активной и вскоре выполнила движение, которое можно было подкрепить, что привело к несомненному прогрессу на последующих занятиях. Я сама бывала в таком же положении, как этот дельфин. Когда мне было пятнадцать лет, самым большим удовольствием для меня были уроки верховой езды. Конюшни, где я занималась, продавали билеты, каждый на десять уроков; по своим деньгам я могла позволить себе один билет в месяц. В то время я жила с отцом, Филиппом Уили, и мачехой, Рики; и хотя они относились ко мне очень хорошо, я вступила в один из тех периодов юности, когда беспрерывно целыми днями бываешь невыносимо грубым и противным. Однажды вечером супруги Уйди, которые были любящими и изобретательными родителями, сказали, что они ужасно устали от моего поведения и поэтому решили меня наградить. И они презентовали мне ослепительно новый, дополнительный бесплатный билет на верховую езду. Один из них не поленился съездить на конюшни, чтобы купить его. Поразительно! Незаслуженный куш. Как мне помнится, я с ходу переменилась, и Рики Уйди подтвердила это много лет спустя, когда я писала эту книгу. Почему назаработанный куш может оказать такое внезапное и далеко идущее влияние, я не совсем понимаю. Может быть, со временем кто-нибудь напишет диссертацию по этому поводу и объяснит нам это. Я только знаю, что дополнительный билет на верховую езду мгновенно снял у меня сильные чувства угнетенности и обиды, и я подозреваю, что и дельфин чувствовал то же самое.
Условное подкрепление.
Очень часто, особенно при работе с пищевым подкреплением, его невозможно дать в тот момент, когда субъект делает то, что хотели бы поощрить. Если я учу дельфина прыгать, то я никак не могу дать ему рыбку в тот момент, когда он находится в воздухе. Если за каждым прыжком следует брошенная рыбка (отставленное подкрепление), то у животного в конце концов образуется связь между прыжком и едой, и оно будет прыгать чаще. Однако это не несет информации о том, какой из аспектов прыжка мне нравится. На какую высоту? С каким прогибом? Может, надо войти обратно в воду со всплеском? Таким образом, потребуется очень много повторений, чтобы животное установило, какой именно прыжок я имела в виду. Чтобы обойти эту трудность, мы используем условное подкрепление. Условное подкрепление представляет собой какой-либо изначально ничего незначащий сигнал - звук, свет, движение, - который умышленно связывают с подачей подкрепления. Тренеры дельфинов остановили свой выбор на полицейском свистке: его хорошо слышно даже под водой и он не связывает руки, чтобы можно было давать сигналы и бросать рыбу. С другими животными я обычно использую "сверчка", десятицентовую игрушку, которая щелкает, когда на нее нажимаешь, или особые поощряющие слова, выбранные и приберегаемые для использования в качестве условного подкрепления: "хорошая собака", "хорошая лошадка". Школьные учителя часто прибегают к некоторым таким ритуальным и тщательно нормированным словам похвалы - "замечательно" или "очень хорошо", - за которые дети страстно работают и ждут их. Наша жизнь изобилует условными подкреплениями. Нам нравится слышать, как звонит телефон или видеть набитый почтовый ящик, даже если половина звонков неинтересна и большая часть корреспонденции - утиль, потому что множество случаев научили нас связывать звонок или конверт с хорошим. Нам нравится рождественская музыка, и мы ненавидим запах зубного кабинета. Мы храним окружающие нас вещи - картины, посуду, трофеи - не потому, что они красивы или полезны, а потому, что они напоминают нам о временах, когда мы были счастливы, или о людях, которых мы любили. Они представляют собой условные подкрепления. Практически дрессировка животных с использованием положительного подкрепления почти всегда должна начинаться с выработки условного подкрепления. Прежде чем начать выработку поведения как такового, пока субъект еще ничего особенного и не делает, вы учите его понимать значимость условного подкрепления, сочетая его с пищей, поглаживанием иди другим истинным подкреплением. Иногда, по крайней мере при работе с животными, вы можете уловить, когда субъект начинает узнавать ваш сигнал, означающий "Хорошо!". Видно, как животное вздрагивает при действии условного подкрепления и начинает искать истинное подкрепление. После выработки условного подкрепления в ваших руках оказывается реальный способ сообщения животному, что в его поведении вас интересует. Чтобы разговаривать с животными, вам не обязательно быть доктором Дулиттлом, можно очень многое сказать таким выработанным подкреплением. Условные подкрепления приобретают чрезвычайную силу. Так как информация "Ты прав" сама по себе представляет ценность, она не обязательно должна сопровождаться первичным подкреплением. Фактически использование пищи, ласки или чего-нибудь в этом роде можно практически свести к нулю, а условное подкрепление будет приносить прекрасные результаты. Я видела, как морские млекопитающие долго работали после насыщения за условные подкрепления, а лошади и собаки работают по часу и более с маленьким или безо всякого безусловного подкрепления. Люди конечно же тоже могут бесконечно работать за деньги, являющиеся ничем иным как условным подкреплением, обозначением вещей, которые на них можно купить, особенно люди, которые уже заработали гораздо больше денег, чем они когда-либо смогут действительно потратить, и, следовательно, пристрастившиеся к условному подкреплению. Действие условного подкрепления можно усилить, сочетая его с несколькими безусловными подкреплениями. В данный момент субъект может не хотеть, скажем, есть, но если тот же подкрепляющий звук или слово были умышленно связаны еще и с водой или другими потребностями или приятными моментами, он сохраняет свое действие и в этом случае. Мои кошки слышат слова "хорошая киса!", когда получают ужин, когда их гладят, когда их впускают в дом и выпускают из дома, когда они проделывают маленькие трюки и получают за них вознаграждение. В результате я могу использовать эти слова для поощрения кошки, спрыгивающей с кухонного стола, и нет нужды сопровождать его каким-либо безусловным подкрепдением. Быть может, причина того, что деньги оказывают на нас такое подкрепляющее действие, кроется в том, что они могут связываться практически с чем угодно. Это чрезвычайно обобщенное условное подкрепление. Как только вы выработали условное подкрепление, вы должны пользоваться им осторожно, не разбрасывать без толку, иначе его сила уменьшится. Дети, которые ездили на моих уэльских пони, очень скоро научились говорить: "Хорошая лошадка!" только когда хотели подкрепить поведение. Если им просто хотелось выразить свою привязанность, они могли болтать с пони, как угодно, не употребляя этих слов. Однажды девочка, которая только что присоединилась к их компании, начала гладить пони, приговаривая: "Ты хорошая лошадка!". Трое остальных тотчас же ополчились на нее: "Ты за что ему это говоришь? Он же ничего не сделал!". Подобным же образом можно и должно окружить заботой и вниманием детей, супруга, родителей, любимых и друзей безотносительно к какому-нибудь определенному поведению, но необходимо приберечь что-то специально в качестве условного подкрепления чего-либо определенного. Существует множество реальных событий, заслуживающих похвалы, подкрепления, которым щедро обмениваются в счастливых семьях. Однако фальшивая или незначимая награда вскоре вызывает негодование даже у маленьких детей и теряет всякую силу в качестве подкрепления. Можно выработать и условное отрицательное подкрепление, которое может быть очень полезным. Дети и многие животные часто моментально реагируют на резкое, громкое слово запрета, которое ничем не сопровождается. Возможно, оно является первичным или безусловным подкрепле нием. Но некоторые животные - особенно этим славятся кошки - игнорируют окрики и брань. Одна моя подруга со вершенно безуспешно пыталась отучить свою кошку царапать кушетку, используя в качестве отрицательного подкрепления возглас "Нет!". Однажды в кухне она уронила большой латунный поднос, случайно упавший почти рядом с кошкой, и, когда раздался громкий грохот подноса, воскликнула: "Нет!". Кошка была страшно напугана, подпрыгнула вверх, подняв шерсть дыбом. В следующий раз, когда кошка начала драть кушетку, хозяйка крикнула: "Нет!", у кошки сделался испуганный вид, и она тотчас же перестала. Двух-трех повторений ставшего условным слова оказалось достаточно, чтобы навсегда прекратить это поведение.
Режимы подкрепления.
Бытует неправильный взгляд, что если вы начали вырабатывать поведение с помощью положительного подкрепления, то должны продолжать его применение на протяжении всей дельнейшей жизни субъекта, если этого не будет, то поведение исчезнет. Это неверно: постоянное под крепление необходимо только на стадиях обучения. Вы можете несколько раз вознаградить годовалого ребенка за пользование горшком, но как только поведение заучено, предмет обучения сам о себе позаботится. Мы даем или должны давать начинающему множество подкреплений - обучение ребенка езде на велосипеде идет под настоящий поток: "Правильно, крепче держи руль, у тебя получилось, хорошо!" Но вы будете выглядеть довольно глупо (а ребенок решит, что вы сошли с ума), если вы будете продолжать хвалить его после того как навык установился. Для того чтобы поддерживать уже выученное поведение на определенном уровне надежности, не только не надо подкреплять его все время, а даже, наоборот, следует прекратить регулярные подкрепления и перейти на эпизодическое использование подкрепления, подаваемого в случайном и не предсказуемом порядке. Это и есть то, что психологи называют вариабельным режимом подкрепления. Вариабельный режим гораздо более эффективен для поддержания поведения, чем постоянный, предсказуемый. Один психолог объяснил это мне так: если у вас машина новая и всегда хорошо заводилась, а однажды, когда вы сели в нее, повернули ключ, она не завелась, то вы, может быть, и попробуете завести ее еще несколько раз, но скоро решите, что что-нибудь не в порядке, и позвоните в гараж. Поведение, состоящее в поворачивании ключа, при отсутствии ожидаемого немедленного подкрепления быстро угаснет. С другой стороны, если у вас вместо машины старая консервная банка, которая еще ни разу не заводилась с первой попытки, и каждый раз требуется целая вечность для того, чтобы привести ее в движение, вы можете продолжать попытки ее завести в течение получаса; ваше поведение по поворачиванию ключа происходит в низковероятностном режиме подкрепления и поэтому сильнейшим образом поддерживается. Если давать дельфину рыбку за каждый прыжок, то скоро прыжки станут невысокими, небрежными, лишь бы отделаться. Если теперь перестать давать рыбу, дельфин тут же перестает прыгать. Но, если после того как животное научилось прыгать за рыбку, начать подкреплять первый прыжок, затем третий и так далее наугад, поведение будет поддерживаться на более высоком уровне: не получив подкрепления, животное станет прыгать чаще, стараясь угадать счастливый номер, и прыжки могут даже усилиться. В свою очередь это позволит подкреплять выборочно наиболее сильные прыжки, - то есть посредством вариативного режима совершенствовать деятельность. Но даже некоторые профессиональные дрессировщики не могут правильно использовать вариативный режим положительного подкрепления; многим эта концепция представляется особенно трудной, не укладывающейся в голове. Нам понято, что нет нужды продолжать наказывать за неправильное поведение, если оно прекратилось, но почему бы не вознаграждать постоянно за правильное поведение. Мы не так уверены в этом только когда ставим целью добиться с помощью положительного подкрепления улучшения дисциплины. Действенность вариатавного подкрепления лежит в основе всех азартных игр. Если каждый раз, опустив в автомат 5 центов, будете получать десять, то скоро вы потеряете к этому интерес. Да, вы будете делать деньги, но какой это нудный способ! Людям нравится играть с автоматом именно потому, что невозможно предугадать заранее, то ли ничего не получишь, то ли какую-то мелочь, то ли сразу кучу денег, и когда именно будет это подкрепление (это может быть только один самый первый раз). Почему одни люди втягиваются в азартную игру, а другие могут поиграть и бросить, это уже другой вопрос, но для тех, кто попался на крючок, этим крючком стал вариативный режим положительного подкрепления. Чем длительнее интервалы между подкреплениями в вариативном режиме, тем сильнее он стимулирует поведение. Однако режимы с длительными интервалами работают против вас, когда вы пытаетесь угасить поведение. Если поведение не подкреплять совсем, то скоро появится тенденция к его угасанию; но если оно все-таки время от времени подкрепляется - неважно сколь эпизодично - одна сигарета, одна рюмка, одна поблажка ворчуну или нытику - и поведение вместо того, чтобы угасаться, может быть значительно усилено режимом с длительными интервалами между подкреплениями. Всем встречались люди, которые непонятным образом привязаны к супругам или любовникам, которые с ними плохо обращаются. Мы привыкли думать, что так бывает только с женщинами - она чувствует влечение к тому, кто груб, невнимателен, эгоистичен и даже жесток, она его все равно любит, - но это случается и с мужчинами. Каждый знает людей, которые после развода или другого рода утраты одного негодяя находят другого, в точности похожего на предыдущего. Являются ли эти люди вечными жертвами по каким-либо глубоким психологическим причинам? Возможно. Но, может быть, они - жертвы режима с длительными интервалами между подкреплениями? Если вы вступили в связь с очаровательным, обаятельным, интересным в сексуальном плане, веселым и внимательным человеком, а затем он становится все более несговорчивым, даже обидчивым, но все же время от времени проявляет свои хорошие качества, вы станете жить ради этих все более редких моментов, когда вы получаете это прекрасное подкрепление: полное очарования, обаяния, привлекательности и веселья внимание. И парадоксально с точки зрения здравого смысла, но закономерно с точки зрения теории обучения, что чем реже и непредсказуемей становятся такие моменты, тем сильнее становится их подкрепляющий эффект, и тем дольше ваша линия поведения будет сохраняться. Кроме того, легко понять, почему человек, однажды оказавшийся в таких отношениях, часто ищет их повторения: ему может казаться, что во взаимоотношениях с нормальным человеком, который сдержан и доброжелателен большую часть времени, не хватает остроты того редкого, страстно желаемого и потому вдвойне действенного подкрепления. Посмотрите на ситуацию с точки зрения человека, управляющего поведением: я могу держать ее (его) в безоговорочном подчинении, так, "Чтобы она (он) делала все, что я захочу, ради моего удобства и спокойствия, до тех пор пока я даю ей (ему) все, что она (он) хочет... изредка. Это один из способов, которыми сутенеры держат в повиновении своих девочек. Конечно, это крепкие путы, но однажды жертва осознает, что сила "очарования" по крайней мере отчасти зависит от режима подкрепления, и спокойно уйдет от этого типа отношений и поищет что-то другое.
Исключения из правила вариативного подкрепления.
Лишь в одном случае не следует прибегать к вариативному режиму подкрепления, после того как поведение заучено, - это когда оно направлено на решение своего рода головоломки или теста. При одном из видов дрессировки собака должна выбирать из нескольких разнородных предметов тот, который побывал в руках у хозяина и хранит его запах. При этом необходимо каждый раз говорить собаке, что она выбрала правильно, чтобы в следующий раз она знала, что надо делать. В тестах на различение, - скажем, идентификация более высокого из двух звуков - необходимо подкреплять каждый правильный ответ испытуемого, чтобы он был постоянно информирован о том, какую задачу он решает (подойдет, конечно, и условное подкрепление). Когда мы отгадываем Кроссворд или составляем картинку-загадку, мы получаем подкрепления за правильные догадки, так как только они являются "подходящими". Если бы при составлении картинки-загадки можно было вставить в одну ячейку несколько кусочков, то положительного подкрепления за правильный выбор, который является обязательной обратной связью в любой ситуации выбора, не получалось бы.
Долговременные программы поведения.
В дополнение к вариативному режиму подкреплений можно ввести и закрепленный, при котором субъект знает, что он должен работать определенное время или выполнить определенный комплекс поведенческих реакций за каждое подкрепление. Например, подкрепляя каждый шестой прыжок, можно сделать так, что дельфин будет прыгать шесть раз подряд, и вскоре получим стабильные серии из шести прыжков. Трудность работы с фиксированным режимом подкрепления состоит в том, что первые ответы в сериях не подкрепляются и возникает тенденция к уменьшению затрачиваемых на них усилий. У прыгающего дельфина со временем все прыжки, кроме последнего, который действительно подкрепляется, уменьшаются. Это отрицательное влияние фиксированного режима подкреплений является важным фактором во многих видах человеческой деятельности - например на заводском конвейере. Чтобы получить подкрепление, необходимо работать в течение определенного времени, но так как подкрепление дается в фиксированном режиме, независимо от качества выполнения, человек совершенно естественно стремится делать то наименьшее количество работы, которое позволяет не выпасть из игры, особенно низкая производительность может быть в начальный период работы. Зарплата по пятницам является фиксированным подкреплением, делающим понедельник тяжелым днем. У дельфинов поддержать поведение поможет случайное подкрепление первого или второго прыжка, помимо шестого. У людей могут быть эффективны различные виды прогрессивных оплат или других подкреплений (например, награды), тесно связанные с качеством и количеством продукции и выдаваемые неодновременно с обычным подкреплением. Применяя либо фиксированный, либо вариативный режимы подкрепления можно оттренировать чрезвычайно длинные цепи поведенческих реакций. Можно добиться того, что цыпленок будет клевать кнопку сто и более раз за каждое зернышко пшеницы. Для людей также можно привести много примеров отставленного вознаграждения. Один психолог шутит, что самым длительным режимом неподкрепляемого поведения в человеческой жизни является учеба в школе. При режимах подкрепления с чрезвычайно длительными интервалами иногда создаются ситуации, которые не приносят организму полезного результата. Для цыпленка это определяется обменными процессами: когда на клевание кнопки он начинает тратить больше энергии, чем может восстановить при получении пшеничного зерна, поведение начинает угасать -- цена работы падает так низко, что ее просто становится незачем делать. Конечно, так часто бывает и с людьми. Другое явление, встречающееся при очень длительных интервалах между подкреплениями, - замедленный старт. Начав клевать, цыпленок совершает эти действия с постоянной частотой, так как каждый удар приближает его к подкреплению, но было отмечено, что по мере того, как увеличиваются интервалы между подкреплениями, он стремится "отложить" начало реакции на более длительный срок. Это и называется "отсроченное начало поведения с долговременной программой" и очень распространено в жизни людей. В любой долгосрочной задаче, начиная с уплаты подоходного налога и кончая уборкой гаража, можно придумать бесконечное количество причин для того, чтобы не начать дело безотлагательно. Написание чего-либо, иногда даже просто письма, тоже поведение с долгосрочной программой. Когда оно уже начато, все идет прекрасно. Но так трудно заставить себя сесть и начать! Джеймс Турбер находил, что начать статью настолько трудно, что иногда он обманывал свою жену (которая по понятным причинам была чрезвычайно заинтересована в том, чтобы он писал статьи, так как доход с них шел на оплату квартиры), лежа все утро на диване в кабинете и читая книгу, которую он держал в одной руке, а другой стучал по клавишам пишущей машинки. Феномен отстроченного начала перевешивал явное положительное подкрепление в виде денег, а симуляция печатанья на машинке, по крайней мере, предотвращала отрицательное подкрепление упреков жены. Один из способов преодоления феномена отсроченного начала заключается в том, чтобы вводить какое-либо подкрепление именно за старт, так же, как я эпизодически подкрепляю у своих дельфинов первый или второй прыжок в серии из шести. Я успешно применяла этот прием и в самовоспитании. В течение нескольких лет один или два раза в неделю я посещала вечерние занятия, что требовало много времени - три часа занятий и по часу на дорогу в один конец. Каждый раз, когда приближалось 5 часов, появлялось сильнейшее искушение не ездить. Но потом я обнаружила, что, если я разобью поездку - первую часть дела - на пять этапов: путь до станции метро, посадка в поезд, пересадка на другой, автобус до университета и, наконец, восхождение по лестнице до аудитории, и подкреплю каждое из этих начальных поведений после его выполнения маленьким кусочком шоколада, который я очень люблю, но обычно не ем, я стала способна вытащить себя из дома, а через несколько недель была в состоянии проделать весь путь на занятия без шоколада и без внутренней борьбы.
Суеверия: случайные подкрепления.
В реальной жизни подкрепления возникают на каждом шагу и часто представляют собой лишь случайное стечение обстоятельств. Один биолог, изучавший ястребов, заметил, что если ястреб поймал под каким-либо кустом мышь, то в течение недели, а иногда и больше, он будет ежедневно проверять этот куст; вероятность его полета именно над этим местом обусловлена силой подкрепления. Попробуйте пройти мимо мусорной корзины, тщательно к ней не приглядываясь, если накануне - нашли в ней пять долларов. Случайное подкрепление полезно для ястреба; вообще можно сказать, что поведение животных эволюционировало так, что каждый вид обладает возможностью извлекать пользу из любого подкрепления. Однако многие случайные подкрепления не сопровождаются полезным результатом, но тем не менее могут оказать сильное влияние на поведение. Когда поведение не связано с последующими событиями, но в мозгу субъекта связывается с ними в качестве необходимого условия их осуществления, говорят о суеверном поведении. Пример этого - человек, грызущий карандаш. Если во время экзамена вам случится взять в рот карандаш и тут же вам придет в голову правильный ответ или хорошая мысль, то такое подкрепление может изменить ваше поведение: хорошие мысли пришли, когда грыз карандаш, таким образом, это действие подкрепляется. Когда я училась в колледже, у меня не было ни одного карандаша, не покрытого отметинами от зубов, - на особенно трудных экзаменах я иногда перегрызла карандаш пополам. Я была уверена, что это помогало мне думать. В действительности же это было всего лишь случайно обусловленное поведение. То же самое можно сказать отношении определенной одежды или совершении некого ритуала перед тем как взяться за какое-либо дело. Я видела одного бейсболиста, который совершал девятичленную цепочку действий каждый раз, когда готовился подать мяч: дотрагивался до кепки, касался мячом перчатки, сдвигал кепку вперед, тер ухо, сдвигал кепку назад, шаркал ногой и т.д. В трудные моменты он мог повторить все девять действий дважды, никогда не нарушая их порядок: Эта последовательность действий совершалась очень быстро, комментаторы никогда не останавливались на ней - но тем не менее она представляет собой сложное суеверное поведение. "Суеверия" часто возникают при дрессировке животных. Животное может руководствоваться в своих ответах такими критериями, которые вы и не собирались вводить, но которые часто случайно совпадали с подкреплениями и образовали условную связь. Например, животное может считать, что чтобы получить подкрепление, оно должно находиться в определенном месте, повернуться в какую-либо сторону или особым образом сидеть. Когда вы захотите, чтобы оно работало в новом месте или при другой ориентации, внезапно загадочным образом все поведение ломается, и пойди пойми почему это произошло. Поэтому гораздо лучше, как только поведение начинает формироваться, начинать разнообразить варианты условий, которые не представляются вам важными, чтобы не возникло какого-либо случайного обусловливания, которое впоследствии будет вам мешать. Более всего следите, чтобы не образовывались случайные временные связи. Как животное, так и люди очень хорошо чувствуют временные интервалы. Однажды я была совершенно уверена, что обучила двух морских свинок прыгать по команде (по сигналу моей руки), пока один из посетивших нас ученых не доказал мне с секундомером в руке, что они прыгают каждые двадцать девять секунд. Это у меня произошло случайное обусловливание подачи команды с очень большой регулярностью, а они воспользовались этим вместо той информации, которой они должны были пользоваться по моему предположению. Многие потомственные дрессировщики находятся просто в плену суеверного способа мышления и поведения. Среди них я встречала некоторых, которые говорили, что дельфины предпочитают людей, одетых в белое, что мулов необходимо бить, что медведи не любят женщин и т.д. Это относится и к тем, кто работает с людьми и считает, например, что на пятиклассников необходимо кричать и что наказание необходимо, чтобы добиться уважения. Такие воспитатели находятся во власти традиции, они вынуждены всегда работать одними и теми же способами, так как не могут разделить действенных методов от того, что является просто суеверием. Эта слабость, или смешение, обнаруживается у представителей многих профессий - в образовании, технике, военном деле, но в большей мере, пожалуй, в медицине. Ужас сколько всего назначается пациенту не потому, что это обладает целебными свойствами, а просто потому, что так всегда делали или все сейчас делают. Каждый, кто хоть раз лежал в больнице, может вспомнить с полдюжины примеров ненужных действий, которые представляют собой не более как суеверное поведение. Интересно, что суеверное поведение не исчезает, если вы просто указываете на его неэффективность; будучи очень сильно заученным, оно соответственно сильно оберегается. Попробуйте поговорить с врачом о его привычке использовать неэффективное или даже вредное лечение, и вы получите отпор в соответствующих выражениях; я уверена, что и тот бейсболист с девятиступенчатым суеверным выражением нервного возбуждения будет яростно противиться всякому, кто предложит ему играть в мяч, скажем, без кепки, до которой он четырежды дотрагивается. Единственный способ избавиться от суеверного поведения - это убедиться, что оно не связано с подкреплением. Мой сын Тэд очень любит фехтование. Два-три раза в неделю он ходит на тренировку, а по выходным часто ездит на соревнования. Однажды во время поединка с сильным партнером он почувствовал себя подавленным, потому что оставил дома свою любимую шпагу. Он проиграл матч. Потом он понял, что ощущение подавленности, очевидно, гораздо больше влияет на его действия, чем та шпага, которой он пользуется, а следовательно, иметь "любимую" шпагу - суеверие. Тэд выявлял и боролся с любым суеверным поведением, которое могло бы связаться с фехтованием. Он обнаружил у себя много таких пунктиков, начиная с привязанности к некоторым предметам одежды до внутреннего убеждения, что на его бой может повлиять приснившийся сон, спор или даже отсутствие фруктового сока на соревнованиях. Систематически анализируя каждое из этих обстоятельств, он разорвал одну за другой свою зависимость от них, так как понял, что это суеверия. И в результате теперь он выходит на каждый бой спокойным и уверенным, если даже перед этим ему снился кошмар про опоздание на поезд, потерю снаряжения, баталии с таксистами, если даже он фехтует одолженной шпагой в тренировочном костюме и в разных носках.
Чего можно добиться с помощью положительного подкрепления.
Вот несколько примеров того, чего добились мои знакомые с помощью положительного подкрепления: Джуди, дизайнер по профессии, чтобы оставаться в форме, поступила в вечерний рисовальный класс при соседнем университете, где занятия происходили раз в неделю; из двадцати человек в классе большинство тоже были дизайнерами, либо коммерческими художниками. Преподаватель на неделю задавал домашнюю работу, выполнением которой многие из этих занятых людей себя не утруждали. Преподаватель каждый раз по десяти, а то и более минут разглагольствовал о слабом выполнении домашних заданий. Устав от того, что их без конца бранили, Джуди предложила преподавателю подкреплять тех. Кто принес домашние работы, вместо того чтобы вправлять мозги тем, кто не сделал их. Так он и поступил, подкрепляя своих учеников публичной похвалой за каждое выполненное задание. К третьей неделе в классе не только улучшилось настроение, но и возросло число выполнивших домашнее задание с одной трети до трех четвертей класса. Шеннон, студентка колледжа, пришла в гости к одним знакомым и застала такую сцену. Четверо взрослых безуспешно и не без некоторого риска для себя пытались удержать немецкую овчарку и полечить ее больное ухо. Шеннон, которая не особенно любит собак, но изучает роль положительного подкрепления, достала из холодильника немного сыра и за пять минут научила собаку сидеть смирно, пока она без посторонней помощи обработала ей ухо. Молодая женщина вышла замуж за человека, который очень любил распоряжаться и командовать. Хуже того, и его отец, который жил с ними, тоже взялся помыкать невесткой. Эту историю рассказывала мне мать девушки. Она была в ужасе, когда впервые увидела, что приходится терпеть ее дочери. "Не беспокойся, мама, - сказала дочь, - поживем - увидим". Дочь взяла за правило как можно меньше реагировать на команды и резкие реплики, и одновременно подкреплять послушанием и живостью реакции любое проявление вежливости и внимания со стороны мужчин. За год она превратила их в очень славных людей. Теперь, когда она приходит домой, они встречают ее улыбками, и оба с радостью соглашаются помочь с покупками. Одна восьмиклассница, жившая в городе, любила по выходным брать свою собаку на загородные прогулки, но собака часто убегала очень далеко и не возвращалась на зов, особенно когда наступала пора ехать домой. Однажды во время прогулки, когда, бегая туда-сюда, собака сама подходила к девочке, та начала очень живо на это реагировать - хвалить, гладить, болтать, обнимать, возиться с собакой. Когда пришло время ехать домой, девочка позвала собаку, и та с радостью подошла к ней. Громадное радушие в качестве положительного подкрепления, очевидно, перевесило обычное продление собакой своей свободы. Больше на прогулках неприятностей с ней не было. Новый администратор одного грозного босса прикинул, что из его работы может являться подкреплением для босса - например принесение бумаг на подпись, - и старался как можно чаще приурочить это дело ко времени, когда босс не был в ярости. Босс стал спокойнее и, подписывая бумаги, стал даже отпускать шутки. Некоторые люди создают особые типы подкреплений, чтобы заслужить их, другие готовы многим пожертвовать. Аннет, неработающая женщина, имеющая взрослых детей и живущая за городом, была бы практически оторвана от мира, если бы не обилие друзей, которые звонят ей по телефону каждую неделю, а то и чаще, чтобы поделиться новостями. Это не только соседи или родственники, звонят и многие занятые работающие, женщины, живущие далеко. И я одна из них. Почему же мы все звоним Аннет? Если у вас плохие новости - вы заболели гриппом, у вас грядет ревизия или няня вашего ребенка переехала в Кливленд, - вы получите у Аннет сочувствие и совет; но так поступит и любой друг при хороших же новостях от Аннет получаешь необычайное подкрепление. Сообщите ей, что банк открыл вам кредит, она не просто скажет: "Колоссально!". Она точно расскажет чем вы это заработали и заслужили. "Вот видишь? - откликнется Аннет. -- Вспомни, как ты много работала, чтобы обеспечить хорошую сумму кредита. Вспомни все неприятности, которые у тебя были с телефонной компанией и с получением билета на самолет. Это тебе награда; в тебе признали деловую женщину. Для этого надо было делать правильные шаги, и ты их делала. Я просто горжусь тобой!" Невероятно! Это больше, чем одобрение, это подкрепление за прошлые усилия, которые в данное время кажутся в основном неудачами. Аннет принимает хорошие новости не с точки зрения "удачи", а превращает их в подкрепление. Это конечно же подкрепляет вашу склонность звонить Аннет.
Организованное подкрепление.
Собрания участвующих в распродаже, клубы организации рекламы, курсы Дейдла Карнеги, общество контроля за собственным весом, да и большинство организаций, в которых происходит групповое обучение самоусовершенствованию используют в основном влияние подкрепления индивидуума группой. Похвала, медали, церемонии награждения и другие формы группового признания являются мощными подкреплениями, используемыми иногда с большим воображением. Директор фирмы, занимающейся распродажей, желая вознаградить свою "команду" за удачный год, арендовал футбольный стадион, устроил большой праздник для служащих старших администраторов и членов их семей; он сделал так, что комиссионеры выбегали на поле через туннель для игроков, а на табло под аплодисменты всех присутствующих вспыхивали их имена. Несколько лет назад я посещала курсы хозяйствования Вернера Эрхарда, программа не лишена духа торгашества, но с точки зрения обучения это, как мне кажется остроумное, а часто даже блестящее применение формирования и подкрепления. Программа, называлась, и я думаю справедливо, тренировкой. Руководитель назывался тренером. Целью формирования было лучше познать самого себя, а основным подкреплением были не реплики тренера, а поведение всей группы, не имеющее словесного выражения. Чтобы групповое поведение стало подкреплением, 250 человек, составлявших группу, просили аплодировать каждому выступавшему независимо от того, понравилась ли им речь или нет. Таким образом, с самого начала застенчивые были ободрены, смелые вознаграждены, и все выступления, как проникновенные, так и бессодержательные получили признание группы. Поначалу аплодисменты были не более чем обязанностью. Но скоро они стали действительно коммуникативным средством, выражающим не степень удовольствия, как в театре, а оттенки чувств и значений. Например, в нашей группе, а я полагаю, что такое бывает в каждой подобной группе, был заядлый спорщик, который часто подвергал сомнению то, что говорил тренер. Когда это произошло в третий или четвертый раз, тренер вступил с ним в спор. Всем было ясно, что с точки зрения логики любитель споров на этот раз был в общем-то прав. Но поскольку спор тянулся и тянулся, всем остальным в аудитории было все равно, кто прав. Все 249 человек желали только одного: чтобы он замолчал и сел на место. Правила игры, то есть формирующие правила, не позволяли нам протестовать или сказать ему, чтобы он замолчал. Но постепенно всеобщее молчание дошло до его сознания. Мы видели, что он начинает понимать, что никому нет дела до того, что он прав. Может бытъ, не всегда надо доказывать свою правоту. Мало-помалу он погрузился в молчание и сел. Группа немедленно разразилась целой бурей аплодисментов, выражавших сочувствие и понимание наряду с сердечным облегчением - очень мощное положительное подкрепление озарения, которое пришло к спорщику. Случаи обучения такого типа, в которых важную роль играют поведенческие аспекты, а не словесное выражение, безумно трудно объяснить постороннему. Эрхард, подобно учителю дзен, часто прибегает к афоризмам; в случае описанного выше спорщика говорится так: "Когда ты прав, с тебя требуется только одно - быть правым". Это значит, что не обязательно нравиться или вызывать другие приятные чувства: только быть правым. Если бы мне пришлось привести этот афоризм на вечеринке, на которой кто-нибудь распинается, человек, окончивший курсы, посмеялся бы, да и любой хороший современный тренер посмеялся бы, но большинство присутствующих решило бы, что я не в своем уме или пьяна. Озарение при тренировке не требует словесного выражения.
Самоподкрепление.
Одним из наиболее полезных практических применений подкрепления является самоподкрепление. Мы им часто пренебрегаем, отчасти потому, что это не приходит нам в голову, отчасти, потому что склонны требовать от себя гораздо больше, чем от других. Как сказал один мой знакомый министр: "Немногие имеют столь низкие критерии, что по ним легко жить". В результате мы часто по несколько дней не расслабляемся, переходя от одной задачи к другой, от нее к третьей, не замеченные и неотблагодаренные даже самими собой. Не говоря уже о подкреплении себя за изменение какой-либо привычки или приобретение нового навыка, какое-либо подкрепление необходимо и просто для будничной жизни; лишение себя подкреплений, мне кажется, - один из факторов повышения нервозности и депрессий.
Вы можете подкрепить себя здоровыми способами - часом досуга, прогулкой, разговором с друзьями или хорошей книгой; или нездоровыми - сигаретами, виски, пищей, от которой толстеют, наркотиками, сидением допоздна и т.д. Мне нравится высказывание актера Рута Гордона: "Актер должен получать комплименты. Если мне приходится долго обходиться без комплиментов, я хвалю себя сам, и это хорошо хотя бы потому, что при этом я уверен в искренности".
II. ПРОЦЕСС ВЫРАБОТКИ: ФОРМИРОВАНИЕ ВЫСШИХ ФОРМ ПОВЕДЕНИЯ БЕЗ ПРИНУЖДЕНИЯ И БОЛИ
Что такое процесс выработки?
Подкрепить поведение, которое уже имеется, чтобы оно возникало чаще, - это понятно, но как обучающим заставить своих подопечных делать то, что случайно может ни когда и не возникнуть? Как заставить собаку сделать сальто назад или дельфина прыгнуть через обруч?
Когда дело касается собак, делающих сальто, дельфинов, прыгающих через обруч, или людей, бросающих баскетбольный мяч в кольцо, то эти действия уже совершаются в процессе выработки. Выработка же состоит в том, чтобы использовать малейшую тенденцию изменений поведения в нужном направлении и шаг за шагом сдвигать ее к поставленной цели. На лабораторном жаргоне это называется последовательное приближение. Процесс выработки возможен потому, что поведение живых существ вариабельно. Что бы живое существо ни делало, в одних случаях оно выполняет это более энергично, чем обычно, а в других случаях - наоборот. Неважно, сколь сложно и трудно то окончательное поведение, которое вы хотите выработать, вы всегда можете, установить ряд последовательных целей, найти какое-либо поведение, которое осуществляется уже сейчас, и использовать его как первый шаг. Например представим, что я решила обучить цыпленка "танцевать". Я могу начать с наблюдения за естественными движениями цыпленка и давать ему подкрепление всякий раз, как он повернется налево. Скоро первая цель будет достигнута: цыпленок начнет поворачиваться налево гораздо чаще, а вследствие вариабельности эти повороты будут то меньшими, то большими. Теперь я могу избирательно подкреплять только более выраженные движения налево - например поворот на четверть круга. Когда эти движения станут преобладающими, естественная вариативность обусловит то, что некоторые повороты будут совершаться менее, чем на четверть круга, а некоторые будут приближаться к половине круга. Я могу повысить критерий, выдвинуть новую задачу и начать отбирать повороты на полкруга и более. Когда цыпленок обучится совершать несколько полных поворотов на большой скорости за одно подкрепление, я могу считать, что достигла своей конечной цели - танцующего цыпленка. Мы все хорошо знакомы с выработкой поведения, являясь участниками или объектами этого процесса. - Попросту говоря, большая часть воспитания ребенка - процесс выработки поведения. Обучение различным физическим навыкам - от тенниса, до печатанья на машинке - представляет из себя в основном выработку поведения. Мы находимся в процессе выработки или, по крайней мере, стараемся что-либо выработать всякий раз, когда упражняемся в чем-либо, начиная от публичного выступления, кончая игрой на фортепьяно. Мы находимся в процессе выработки и тогда, когда пытаемся изменить свое поведение - бросить курить, быть менее застенчивым, лучше распоряжаться деньгами. Достигли или не достигли мы успеха в формировании какого-либо поведения у себя или кого-то другого, в конечном счета зависит не от нашего искусства, а от настойчивости.
Музыкальный критик газеты "Нью-Йорк Таймс" писал об одном европейском дирижере, который не будучи великим музыкантом добивался необыкновенной музыки, заставляя свой оркестр репетировать каждый концерт в течение целого года. Большинство из нас может достичь определенного совершенства почти в любой деятельности, если потратить на это достаточно времени. Но это скучно. Разве мы не хотим всегда обучиться новому - катанию на лыжах, игре на пианино, как и любой другой деятельности - как можно быстрее? Конечно, хотим, и вот тут все дело в правильной выработке навыка. Далее, разве мы не предпочитаем избежать вообще или сократить до минимума повторения? Опять-таки, конечно же, но некоторые физические навыки требуют повторения, потому что мускулы "учатся" медленно, и требуется многократное повторение движений, прежде чем они станут совершаться с легкостью. Но даже в этом случае хорошо спланированная программа выработки может свести до минимума необходимую тренировку и сделать значимым каждый момент практических занятий тем самым чрезвычайно ускоряя совершенствование И наконец, в спорте, музыке и других творческих устремлениях вы можете захотеть развить не только стабильное выполнение навыка, но и выполнение на том наивысшем уровне, который доступен вам или тому, кого вы обучаете. В этом случае правильное использование законов направленной выработки может быть решающим.
Способы и приемы или закономерности.
Есть два аспекта выработки: первый способ и приемы, то есть последовательность шагов, необходимых для выработки типа поведения, и второй - закономерности или правила, предписывающие, как, когда и почему эти типы поведения должны подкрепляться.
Большинство тренеров, большинство книг о тренировке и большинство тех, кто обучает тренеров, - имеет дело потом исключительно со способом или приемом. "Возьмите в руки клюшку для гольфа как показано на рисунке", "Подведите прицел винтовки под нужное место мишени", "Никогда не наклоняйтесь в горах", "Взбивайте яйца металлическим венчиком по часовой стрелке" Это прекрасно. Эти приемы обычно складываются годами при участии многих людей, путем проб и ошибок, и поэтому они оптимальны. В самом деле вы будете более уверенно сидеть на лошади, если пятки у вас опущены, а мяч для гольфа будет послан вами дальше, если вы хорошенько отклонитесь в сторону замаха. Если вы заинтересованы в том, чтобы овладеть каким-либо навыком, я могу вас уверить, что вы извлечете максимум возможного от устоявшихся приемов выполнения действий, которые включаются в данный навык, почерпнув это из книг, от преподавателей, инструкторов и наблюдая или изучая действия других людей. Другую сторону выработки составляют закономерности, которые регулируют сам процесс обучения: когда надо поднажать, когда подослабить обучение; как наиболее эффективно повышать критерии, что делать, если возникли затруднения, и, вероятно, самое главное - когда остановиться. В этих вопросах обычно полагаются на интуицию и опыт тренеров или инструкторов, на случай или удачу. Между тем именно успешность применения этих закономерностей определяет разницу между просто хорошим и великим преподавателями, между радостным, быстрым и успешным обучением и обучением, приводящим к срывам, медленным, скучным и неприятным. Хороший процесс выработки, а не только хорошие приемы, делают обучение эффективным.
Десять правил выработки.
С моей точки зрения существуют десять правил, управляющих процессом выработки. Некоторые - по крайней мере четыре первых - берут начало из психологических лабораторий и установлены экспериментально. Другие, насколько мне известно, даже не являлись предметом специального изучения, но рассматриваются всеми, кто имел дело с выработкой поведения, как неотъемлемая особенность: вы всегда знаете (обычно слишком поздно), когда вы нарушили одно из них. Я перечислю эти правила, а затем несколько подробнее остановлюсь на каждом из них:
Повышайте критерий небольшими градациями, чтобы у субъекта всегда была реальная возможность выполнить требуемое и получить подкрепление.
В конкретный промежуток времени отрабатывайте что-нибудь одно, не пытайтесь формировать поведение по двум критериям одновременно.
Прежде чем увеличивать или повышать критерий, пользуйтесь подкреплением текущего уровня ответа, т.е. подкрепляйте любое исполнение данного действия, имеющегося в данный момент.
Вводя новый критерий, временно ослабьте старые.
Будьте впереди того, кого вы обучаете: полностью планируйте свою программу выработки так, чтобы в случае внезапного успеха обучаемого, вы знали, что следует подкреплять далее.
Не меняйте тренеров на "середине реки"; у вас может быть несколько инструкторов на одного обучающегося, но придерживайтесь одной программы выработки на каждый из типов поведения.
Если одна процедура выработки не приносит успеха, найдите другую, существует столько же способов добиться нужного поведения, сколько инструкторов, способных их придумать.
Не кончайте тренировку, не дав положительного подкрепления, это соответствует наказанию.
Если навык ухудшается, "возвратитесь к детскому саду", быстро повторите весь процесс выработки с серией легких подкреплений.
Оканчивайте, по возможности, каждую тренировку на высокой ноте и в любом случае останавливайтесь, оставаясь впереди обучаемого.
1.Повышайте критерий небольшими градациями, чтобы у субъекта всегда была реальная возможность выполнить требуемое и получить подкрепление. Практически это означает, что, когда вы увеличиваете требования или повышаете критерий подкрепления, вы должны это делать в пределах, доступных в данный момент субъекту. Если ваша лошадь берет барьер в два фута, иногда имея фуг в запасет вы можете увеличить барьер до двух с полови ной футов. Поднять его до трех футов, значит искать себе неприятностей: животное способно на это, но пока не в со стоянии обеспечить стабильности. А повысить барьер до трех с половиной футов означает накликать несчастье.
То, насколько быстро вы можете увеличить критерий, не зависит от фактических возможностей субъекта, нынешних или будущих, никогда не исходите из того, что лошадь большое существо с сильными ногами, способное взять восьми футовое препятствие, или из того, что она обычно перепрыгивает через четырехфутовый забор на пастбище. Быстрота увеличения критерия зависит от того, насколько хорошо ваше взаимодействие в процессе выработки, каковы ваши правила подкрепления.
Каждый раз, как вы увеличиваете критерий, вы меняете правила. Субъекту должна быть дана возможность обнаружить это; несмотря на изменение правил, при некотором увеличении усилий, субъект должен продолжать получать под крепление (но при этом в некоторых случаях выполнение действия на прежнем уровне становится неэффективным).
Это может быть усвоено только в процессе ознакомления с подкреплением на новом уровне.
Если вы повышаете критерий так сильно, что субъекту надо совершить усилия значительно большие, чем он ранее совершал для вас - неважно делал или не делал он это для себя, - вы сильно рискуете. Поведение может быть сорвано.
У прыгуна могут появиться дурные привычки, такие, как останавливаться перед барьером или сбивать его. Привычки, подавление которых потребует много времени. Самый быстрый - а иногда единственный - способ сформировать поведение - это увеличивать критерии такими ступенями, чтобы субъекту легко давалось постоянное улучшение поведения. Непрерывный прогресс, даже дюйм за дюймом, приведет вас к поставленной цели гораздо быстрее, чем попытки форсировать быстрый прогресс с риском потерять все выработанное поведение.
Однажды мне пришлось встретиться с одним отцом, допустившим в этом серьезную ошибку. Так как сын-подросток очень плохо учился, он отобрал у него обожаемый всеми подростками мотоцикл до улучшения отметок. Мальчик стал заниматься лучше, его оценки улучшились, с F и D до D и С.-Однако вместо того, чтобы поощрить этот прогресс, отец сказал, что оценки еще недостаточно хорошие, и продолжал придерживаться своего запрета. Эта эскалация критерия была слишком резкой, мальчик совсем перестал заниматься. Более того, он стал очень недоверчивым.
2. В конкретный промежуток времени отрабатывайте что-нибудь одно, не пытайтесь формировать поведение по двум критериям одновременно. Под этим я не подразумеваю, что вы не можете работать над многими различными типами поведения в один и тот же период времени. Безусловно, вы можете это. Во время любого занятия мы можем сначала немного поработать над качеством, затем над скоростью - в теннисе над ударом слева, затем над ударом справа, затем над работой ног и т.д. Это избавляет от монотонности. Хорошие преподаватели все время меняют работу, оставляя данную задачу, как только в ней достигнут успех, и переходят к другой. Однако, когда вы работаете над данным типом поведения, вы должны пользоваться в каждый данный отрезок времени одним и только одним неизменным критерием. Допустим, что я обучаю дельфина делать фонтан брызг, и один раз не дам ему подкрепление, потому что фонтан недостаточно велик, а другой раз - потому что он направлен не в ту сторону, в итоге у животного не будет ключа к расшифровке того, что я хочу от него. Одно подкрепление не может содержать двух типов информации: я должна сначала довести высоту фонтана до удовлетворяющей меня отметки, а затем формировать его направление вне зависимости от высоты, до тех пор, пока оно тоже не будет заучено; только когда оба критерия установлены, я могу-требовать соблюдения обоих.
У этого правила множество практических применений. Если задачу можно расчленить на отдельные компоненты, которые затем формируются раздельно, обучение пойдет гораздо быстрее. Рассмотрим обучение удару в гольфе, отправляющему мяч в лунку. Попадет ли мяч в лунку зависит от правильности расстояния, на которое послан мяч, - чтобы оно не было меньше, чем расстояние до лунки, и чтобы мяч не перелетел через нее ~ и от направления удара, чтоб мяч не уходил ни в одну, ни в другую сторону от лунки. Если я собираюсь обучиться удару, я буду практиковаться в этих навыках раздельно. Я бы положила на траву пучок шнура длиной в несколько футов и стала бы тренироваться, посылая мяч вдоль него сначала с расстояния двух, затем четырех, шести, десяти футов и т.д. Я могла бы сделать из шнура круг и стала тренироваться попадать в него с определенного расстояния, постепенно уменьшая размер круга, до тех пор, пока не смогла бы надежно попадать в очень маленькую цель. Только когда меня будут удовлетворять мои навыки удара по мячу как для посылки его на нужное расстояние, так и в заданном направлении, я их объединю и, сделав большую цель, начну менять расстояние, а затем стану уменьшать цель и, снова меняя расстояние, добьюсь попадания в маленькую цель с различных дистанций. Затем по мере улучшения навыка удара я могу добавлять новые критерии, по одному в каждый конкретный момент времени.
Это поможет мне стать превосходным или по крайней мере очень хорошим игроком в гольф в зависимости от моей настойчивости и пределов зрительно-моторной координации. Это обеспечит мне, безусловно в пределах моих возможностей, надежность попадания мячом в лунку. Я утверждаю, что любой игрок в гольф, пользуясь такой однозадачной программой выработки, за несколько выходных достигнет большего, чем за целое лето бессистемной тренировки, волей-неволей надеясь достичь каждым ударом и правильности расстояния, и правильности направления.
Часто нам не удается добиться прогресса в каком-либо навыке, хотя мы много упражняемся, потому, что мы пытаемся сразу улучшить две или более стороны деятельности.
Нужно подумать: одно ли свойство характеризует данное поведение? Нельзя ли его расчленить и работать отдельно над различными критериями? Когда вы займетесь этими вопросами, большинство проблем решаться сами собой.
3. Прежде чем увеличивать или повышать критерий, пользуйтесь вариативной шкалой подкреплений имеющегося в данный момент уровня ответа.
Вы помните о вариативной шкале подкреплений? Как только поведение усвоено, вы должны начать подкреплять его не каждый раз, чтобы поддерживать его на данном уровне. Это правило составляет суть процесса выработки. Когда вы можете позволить себе подкреплять данный уровень поведения случайным образом и сохранять уверенность в получении его, вы получаете свободу в использовании подкреплений только за лучшие проявления данного поведения. Такое селективное подкрепление "сдвинет" нормальное или среднее поведение в сторону того улучшения, которое вам желательно. Хорошая выработка представляет из себя серию чуть заметных переходов между непрерывным подкреплением - когда достигнут новый уровень выполнения - и вариативным подкреплением - когда достижение закрепилось и создалась возможность избирательного подкрепления еще более хороших ответов.
Иногда смена стабильных и вариативных шкал происходит очень быстро, составляя два-три подкрепления на каждом уровне. Вероятность этого особенно велика, если у субъекта внезапно наступает "озарение" - он начинает понимать конечную цель, и улучшение поведения становится спонтанным. В этом случае введение вариативной шкалы столь значимо для обучения, что это необходимо постоянно помнить и все время контролировать, не забуксовала ли, не перестала ли приносить успех ваша программа выработки.
4. Вводя новый критерий, временно ослабьте старые.
Допустим, вы учитесь играть в сквош (что-то вроде тенниса) и успешно работаете над одной целью - послать мяч туда, куда вы хотите. Теперь вы хотите поработать над скоростью, но, когда вы усиливаете удар, мяч летит куда попало. Забудьте на некоторое время о точности и просто ударяйте по мячу. Когда вы научитесь управлять скоростью мяча, точность скоро восстановится.
То, что раз выучено, не забывается, но под подавляющим воздействием нового критерия старое, хорошо выученное поведение иногда временно уходит в сторону. Однажды я видела дирижера, который пришел в состояние крайнего раздражения во время генеральной репетиции оперы, потому что певцы хора делали одну ошибку за другой, они как будто забыли всю свою твердо выученную вокальную партию. Причиной было то, что они в первый раз надели тяжелые костюмы, их поставили на подмостки и заставили двигаться во время пения: привыкание к новым условиям временно перекрыло выученное ранее поведение. К концу репетиции их музыкальное мастерство восстановилось без дополнительных репетиций. Дрессировщики дельфинов называют это "синдромом нового бассейна". Когда вы помещаете дельфина в новый бассейн, для вас не должно быть неожиданностью, что он "забудет" все, что знал, пока не привыкнет к новой обстановке. Следует помнить, что ругать себя или других за ошибки в выученном поведении, совершаемые при новых обстоятельствах, непедагогично. Ошибки обычно исправляются в скором времени сами по себе, а выговоры огорчают, а иногда фиксируют внимание на ошибках, которые становятся постоянными.
5. Ведите ученика за собой.
Планируйте программу выработки так, что, если субъект совершит в обучении неожиданный скачок вперед, вы должны знать, что подкреплять далее. Однажды я в течение двух дней обучала только что пойманного дельфина прыгать через препятствие, выступающее над водой на несколько дюймов. Когда поведение прочно установилось, я подняла барьер еще на несколько дюймов, животное тотчас же прыгнуло, и с такой легкостью, что я скоро снова подняла барьер уже на гораздо большую высоту; через пятнадцать минут этот новичок прыгал на восемь футов.
Такого рода "рывок" выработки может произойти в любой момент. Этот феномен наблюдается как у людей, так и у многих видов разумных животных. Я считаю, что тут дело в инсайте (внезапное озарение): субъект внезапно осознает ваши цели, исходя из которых вы добиваетесь его действий (в данном случае - прыгнуть как можно выше), и делает это.
Киты-касатки славятся своим предвосхищающим обучением. У их дрессировщиков в ходу одна и та же шутка: касатку не надо дрессировать, достаточно записать программу поведения на доске и вывесить ее в воде, и киты будут следовать этому предписанию.
Дрессировщики могут встретиться с осложнениями только в том случае, если они оказываются неподготовленными к неожиданному улучшению. Если вы тренируете переход от стадии А к Б, а субъект внезапно чисто выполняет стадию В уже с двух подкреплений, вы должны предусмотреть подкрепление стадии Г и Д, иначе в дальнейшем вам нечего будет подкреплять.
"Рывок" часто эмоционально очень значим для субъекта; даже животные, по-видимому, испытывают удовольствие от "ага!" познания, и часто впадает в состояние явно повышенного настроения. Таким образом, "рывок" - это блистательная возможность добиться значительного прогресса в кратчайшие сроки. Быть не готовым к нему и держать субъект на низком уровне обучения только потому, что вы не знаете, что делать дальше, -лучший способ потратить зря время, а в худшем случае может отбить охоту к обучению и вызывает отвращение у субъекта, который станет в будущем работать без особого желания.
За очень редкими исключениями наша школьная система построена так, чтобы помешать детям обучаться в их собственном темпе - наказываются не только медленные ученики, у которых не хватает времени на обучение, но и слишком быстро обучающиеся, которые не получают дополнительного подкрепления, когда быстрая сообразительность продвигает их вперед. Если ты мгновенно понял, о чем толкует учитель математики, твоей наградой может стать мучение от скуки в течение часов или даже недель, пока все остальные мало-помалу постигнут это. Поэтому нет ничего удивительного в том, что улица более привлекательна как для наиболее быстрых, так и для медленных.
6. Не меняйте тренеров на полпути.
В процессе выработки какого-либо поведения вы рискуете значительным регрессом, если перепоручаете своего ученика другому преподавателю. Не важно, сколь скрупулезно обсуждены критерии перед передачей дела, поскольку и индивидуальные установки, и время реакций, и прогноз успеха будут слегка отличаться, и в итоге субъект утрачивает подкрепления до тех пор, пока не привыкнет к этим отличиям.
Конечно, у каждого обучающегося может быть много различных учителей - мы не испытываем затруднений от того, что один обучает нас французскому, другой - арифметике, третий - футболу. Но то конкретное поведение, которое должно быть разучено, требует только одного учителя в каждый конкретный момент времени. На тех стадиях выработки, когда навык образован наполовину, постоянное повышение критерия осуществляется лучше, если процесс формирования данного поведения находится в одних руках. Допустим, если у вас двое детей и одна собака, и оба хотят обучать собаку, то разрешите им это, но пусть каждый работает над различными, каждый над своими трюками, и тем избавьте бедную собаку от большой неразберихи.
Те, кто хочет учиться, будут учиться при наихудших условиях.
В Колумбийском университете был поставлен получивший в настоящее время широкую известность эксперимент по "языку обезьян", в котором шимпанзе обучали словарю американского знакового языка и другим кодам; в эксперименте принимал участие детеныш шимпанзе по имени Ним Шимрски. По бюджетным и другим соображениям, у бедняжки за трехлетний период было чуть ли не сто "учителей" знакового обозначения. Студенты и экспериментаторы были разочарованы, поскольку Ним не демонстрировал твердых доказательств использования реального "языка". А именно, он, по-видимому, никогда не строил предложений. Но он выучился распознавать и понимать более трехсот символов - существительных, глаголов и т.д., что при данных обстоятельствах, с моей точки зрения, является поразительным. То же самое происходит с некоторыми детьми, которые переходят из школы в школу, проходя через бесконечную смену учителей, приемов и методов обучения, и тем не менее обучаются. Но есть более хорошие способы.
Единственный случай, когда вам следует подумать о смене преподавателя посредине процесса выработки, это, конечно, когда обучение зашло в тупик. Если обучение идет плохо или совсем не идет, то вам нечего терять от перемены.
7. Если одна процедура выработки не приводит к успеху, попробуйте другую.
Поразительно, до чего люди бывают привержены к неэффективной системе, будучи убежденными, что повторение одного и того же даст результаты. Для выработки любого поведения существует столько же способов, сколько инструкторов, способных их придумать. Например, при обучении детей плаванию надо сделать так, чтоб они не боялись и чувствовали себя спокойно под водой. В качестве первого шага формирования этого навыка одни тренеры велят им выдувать в воду воздух, пуская пузыри, другие - быстро опускать в воду и поднимать обратно лицо, а третьи - прыгать в воде, пока они не отважатся просто присесть, чтобы вода закрыла их. Любой хороший тренер, видя, что ребенку скучно или его пугает этот метод, перейдет на другой; одни и те же методы выработки не равноценны для разных индивидуумов.
Дрессировщики, передающие свое искусство от поколения к поколению, такие, например, как цирковые дрессировщики, часто не могут этого усвоить. Их методы дрессировки отточены несколькими поколениями и передаются от одного к другому - вот способ научить медведя кататься на велосипеде, а вот способ обучить льва издавать рык (если хотите знать - надо выдернуть несколько волосков из его гривы). Эти передаваемые из поколения в поколение "рецепты" считаются лучшими способами, а иногда таковыми и являются, но они часто рассматриваются и как единственные способы, что является причиной того, что цирковые представления чрезвычайно похожи друг на друга.
Однажды один телевизионный деятель, который ставил шоу в океанариуме "Жизнь моря", пригласил меня посетить их ферму в Вирджинии и посмотреть, как тренируют лошадей. Эта знаменитость был превосходным наездником и тренером и у него было несколько прекрасно обученных лошадей. Мы наблюдали, как учили лошадь кланяться, или становиться на одно колено при помощи традиционного метода, включавшего двух людей и множество веревок и кнутов; при помощи этого метода лощадь многократно заставляли становиться на одно колено до тех пор, пока она не научилась опускаться на него сама.
Я сказала, что необязательно делать это таким образом, и утверждала, что могу научить лошадь кланяться, даже не прикасаясь к животному (один из вариантов: нарисовать на стене красное пятно; использовать пищу в качестве условного подкрепления выработки у лошади касания коленом пятна, затем постепенно снижать пятно, приближая его к полу, чтобы лошади пришлось встать на колени, чтобы коснуться его и заработать подкрепление). Телевизионная звезда пришла в негодование от такого наглого заявления - что за мысль!
Если бы существовал другой способ научить лошадь кланяться, он бы знал об этом - нам пришлось два или три раза обойти вокруг сарая, чтоб он немного поостыл.
8. Не кончайте урок без положительного подкрепления, это равносильно наказанию.
Это не относится к той несистематической (хотя очень значимой и продуктивной) выработке, которая происходит в домашних условиях, - поощрение учения в школе, гостеприимство, подбадривание детей; здесь подкрепление происходит от случая к случаю, без особых правил. Однако в более официальной ситуации - скажем, на уроке или при выработке поведения у какого-либо животного - преподаватель должен уделять свое внимание ученику или классу до конца урока. Это более, чем просто хорошие манеры или хорошая самодисциплина; это - хорошее обучение. Когда субъект старается заработать подкрепление, он, так сказать, вступает в контакт с преподавателем. Если преподаватель начинает болтать с кем-либо из присутствующих, выходит, чтобы поговорить по телефону, иди просто мечтает, контакт нарушается. Подкрепление не поступает, хотя обучающийся и не сделал ошибки. Это приносит больше вреда, чем если бы преподаватель просто упустил хороший шанс для подкрепления. Это может плохо сказаться даже на хорошо отработанном поведении, которое осуществляется в это время. Конечно, если вы хотите упрекнуть ученика, перестать обращать на него внимание - лучший способ сделать это.
Дрессировщики дельфинов называют это "тайм-аут" и используют для коррекции неправильного поведения. Забрать корзину с рыбой и уйти на минуту - один из способов сказать дельфину: "Нет!" или: "Неправильно!" Обычно это оказывается очень эффективным - не следует думать, что дельфины не могут огорчаться или раскаиваться, они это могут. Лишение внимания - мощный инструмент, поэтому не применяйте его без должной осторожности и несправедливо.
9. Если выученное поведение ухудшается, пересмотрите процедуру выработки.
Иногда навык или поведение портятся, а иногда создается видимость их полной потери. Нам всем знакомо это чувство, когда пытаемся говорить на иностранном языке, вспомнить стихотворение или поехать на велосипеде после многолетнего перерыва: это очень выбивает из колеи. Иногда внешние обстоятельства временно полностью, уничтожают хорошо выученное поведение - например, в состоянии испуга невозможно произнести заученную речь, неудачное падение резко нарушает ваши навыки скалолазанья. Иногда на первоначальное обучение накладывается и мешает ему последующее обучение, создавая путаницу - вы стараетесь найти испанское слово, а всплывает немецкое.
Самый быстрый способ исправить такое ухудшение - не биться об него головой, заставляя субъект делать это до тех пор, пока результат не покажется вам удовлетворительным или пока вы не дадите подкрепление, а вернуться к началу процесса выработки и "очень быстро снова пройти весь путь, давая подкрепление в новых условиях (спустя двадцать лет, на публике и т.д.) и применяя по одному-два подкрепления на каждом уровне. В океанариуме "Жизнь моря" мы называли это "вернуться в детский сад", и такой прием часто восстанавливал ухудшившееся поведение до нормального уровня за десять-пятнадцать минут. Конечно, так мы всегда и поступаем, когда повторяем материал перед экзаменом или освежаем память, заглянув в текст, прежде чем выходим на трибуну. Полезно помнить, что если вы в состоянии в большей или меньшей степени воспроизвести исходный процесс выработки, то такое повторение одинаково полезно и для физических, и для умственных навыков Оно действенно как у животных, так и у людей.
10. Прекращайте работу, оставляя за собой лидирующее положение.
Сколько должен продолжаться каждый сеанс выработки?
Частично это зависит от промежутка времени, в течение которого субъект сохраняет внимание. Кошки часто начинают проявлять беспокойство после, примерно, двенадцати подкреплений, поэтому пяти минут может быть достаточно. Собаки и лошади могут работать дольше. У людей продолжительность различных уроков традиционно равна часу, а занятия футболом, научные семинары и разные другие мероприятия часто длятся целый день.
Когда остановиться, не столь важно, как на чем остановиться. Вы должны всегда прекращать работу, сохраняя ведущее положение. Это относится и ко всему уроку, и к отдельным частям его, когда вы кончаете работать над одним типом поведения и переходите к другому. Вы должны совершать переход на высокой ноте - т.е. сразу как только достигнут успех.
Последнее совершенное действие всегда закрепляется в сознании субъекта; вы должны быть уверены, что это хорошее, вознаграждаемое выполнение. А часто происходит так, что мы получаем три-четыре хороших ответа - собака прекрасно ищет и подает предмет, прыгун в воду впервые выполнил прыжок полтора оборота, певец правильно исполнил трудный пассаж - и мы так возбуждены, что хотим видеть или делать это скова и снова. И мы повторяем это или стараемся повторить, и очень скоро субъект устает, поведение ухудшается, неожиданно возникают ошибки, происходят коррекции и подбадривания, и урок идет насмарку. Наездники-любители поступают так всегда. Вот почему я терпеть не могу смотреть, как люди обучают своих лошадей прыгать; как часто они далеко заходят за черту, где следует остановиться, когда животное выполнило действие хорошо, и прежде, чем поведение не начало снова ухудшаться.
Будучи тренером вы должны, если это необходимо, заставлять себя останавливаться на хорошем ответе. Иногда это требует выдержки. Но на следующем уровне вы можете обнаружить, что принос предмета, сальто при прыжке в воду или вокальное упражнение выполнены не только так же хорошо, как последнее на прошлом уроке, но значительно лучше.
Психологи называют это "латентным обучением". В процессе тренировки возникает некоторый стресс, хотя бы от желания сделать лучше. Этот стресс может влиять на выполнение действия, маскируя реально имеющееся обучение.
В начале следующего урока, прежде чем возникнет стресс, выполнение действия может в действительности быть на шаг впереди по сравнению с тем уровнем, на котором остановились, и тогда вы получаете то, что гораздо более достойно подкрепления.
Формирование поведения таким способом, конечно, противоположно обучению при помощи муштры и повторений. Оно может обеспечить не только стабильный прогресс, но абсолютно безошибочное обучение, и оно может идти чрезвычайно быстро. Однажды я так приучила пони к уздечке за пятнадцать минут, двигаясь непрерывно взад-вперед, формируя пять задач (вперед, остановка, налево, направо и назад). При этом я подкрепляла успех в каждой из них. Как ни странно, возможность такого быстрого обучения зависит от вашей готовности отказаться от временных рамок и постановки специфической цели, цели быстрого прогресса. Вместо этого вы должны быть просто готовы остановиться, оставаясь впереди. Феномен Дзен.
Иногда вы не можете кончать каждый урок на высокой ноте. Возможно, что слушатели оплатили час занятий, и они хотят использовать весь этот час, хотя наилучшее время для окончания урока было достигнуто раньше. А может, урок идет не слишком хорошо, чтобы обеспечить наивысший подъем, и вот-вот наступит усталость. В этом случае наиболее мудро окончить урок чем-нибудь легким, что гарантирует получение подкрепления, чтобы весь урок в целом запомнился как подкрепленный. Дрессировщики дельфинов часто оканчивают длительные, требующие напряжения занятия легкой игрой в мяч; обучающие верховой везде иногда используют разные игры, например салочки. Самым нецелесообразным приемом является введение новых задач или материала в конце занятий, вследствие чего оно заканчивается серией неадекватных и неподкрепляемых ответов. Когда я была ребенком, мои уроки музыки всегда кончались таким способом; это очень обескураживает, и я до сих пор не могу играть на пианино.
Обучающие игры
Даже если вы знаете и понимаете принципы выработки, вы не можете применять их, без предварительной практики.
Выработка это не словесный процесс, это невербальный навык - развертывающийся во времени процесс взаимосвязанного поведения, наподобие танца, ухаживания или серфинга. Поэтому его нельзя до конца познать с помощью чтения, размышления или разговоров. Вы должны выполнять его.
Одним из простых и завораживающих способов развить навыки выработки являются обучающие игры. Я использовала эти игры, обучая технике дрессировки. Многие тренеры играют в них из спортивного интереса; они интересны и для развлечения гостей.
Для игры необходимо по крайней мере два человека: обучающийся и тренер. Оптимально количество шесть человек, потому что тогда каждый может побывать и испытуемым и тренером, прежде чем группа утомится; большая группа, например класс или лекционная аудитория, тоже возможна, потому что наблюдать за этим почти так же увлекательно, как участвовать.
Вы отсылаете испытуемого из комнаты. Остальные выбирают тренера и поведение, которое должно быть сформулировано: например, написать свое имя на доске, попрыгать или взобраться на стул. Испытуемый приглашается в комнату, и его просят двигаться по комнате и производить любые движения; тренер свистком подкрепляет движения в направлении желаемого действия. Я предпочитаю, по крайней мере при первых нескольких подкреплениях, придерживаться правила, чтобы "подопытный" должен был возвращаться к дверям после каждого подкрепления начинать действия заново; это, по-видимому, препятствует развитию у некоторых испытуемых тенденции просто останавливаться в том месте, где было получено последнее подкрепление. И никаких разговоров.
Смех, вздохи и другие проявления эмоций допускаются (разрешаются), но инструкции и обсуждения исключаются до тех пор, пока не достигнуто задуманное поведение.
Обычно обучающие игры протекают довольно быстро. Вот пример: мы вшестером играем в комнате у одного из друзей.
Руфь соглашается быть подопытной, очередь Анны быть тренером. Руфь выходит из комнаты. Мы решаем, что поведение должно состоять в том, чтобы включить лампу, стоящую на столике у кушетки.
Руфь приглашается назад и начинает двигаться по комнате. Когда она поворачивается в сторону лампы, Анна свистит. Руфь возвращается на "старт" (дверь в комнату), затем целенаправленно движется к точке, где получила подкрепление, и останавливается. Свистка нет. Она делает попытку сдвинуться с места сначала в сторону от лампы. Попрежнему свистка не слышно, Руфь снова начинает ходить. Когда она снова направляется к лампе, Анна свистит. Руфь возвращается к двери, а затем снова к тому новому месту, где она только что слышала свисток, но на этот раз она продолжает двигаться вперед. Удача: свисток! Не возвращаясь к двери, она еще немного проходит вперед и слышит свисток, как раз когда проходит мимо конца стола. Она останавливается. Стучит по краю стола. Свистка нет. Разводит руками, свистка нет. Одна рука слегка касается абажура, Анна свистит. Руфь начинает ощупывать со всех сторон абажур - двигать, поворачивать, качать: свистка нет. Руфь опускает руку под абажур. Свисток. Руфь снова опускает руку под абажур и производит очень знакомое действие, имеющее какую-то цель, она осуществляет эту цель и включает лампу. Анна свистит, а мы все аплодируем.
Но не всегда все идет так гладко, даже если поведение простое и знакомое. Если вернуться к только что проделанному эксперименту, то надо сказать, что Анна нашла хорошее решение при обучении, воздержавшись от поДкреПления, когда Руфь пошла в сторону от места, где получила подхрепление первый раз, двигаясь в неверном направлении.
Однако, если бы Руфь снова пошла к тому месту и остановилась бы, у Анны могли бы возникнуть затруднения.
Вот пример обучающей игры, в которой встречается больше затруднений. Я вела занятия по приемам дрессировки в старшем классе школы. Леонард был подопытным, а Бет тренером. На этот раз поведение состояло в том, чтобы включить свет выключателем, расположенным на стене.
Леонард пошел в комнату и начал по ней двигаться, а Бет быстро обучала его подходить к стене, на которой находился выключатель. Однако Леонард начал, свое движение, держа руки в карманах: после нескольких подкреплений за движение с руками в карманах, их там как будто приклеили. Он толкал стену, поворачивался и прислонялся к ней, он даже прислонился к выключателю, но казалось, что он не замечал выключателя и ни разу не вынул рук из карманов.
Наблюдая это, я думала, что если бы была возможность заставить Леонарда ощупывать стену рукой, он заметил бы выключатель и зажег бы свет. Но как вынуть эти руки из карманов? Бет "подловила" с помощью свистка сгибание ног в коленях в то время, когда Леонард стоял спиной к стене, и скоро обучила его тереться спиной о стенку около выключателя. Остальные ученики начали хихикать, так как поняли, что, сдвинув эти движения в сторону, Бет может заставить Леонарда нажать выключатель спиной и тем самым достичь результата случайно, если уж не получается преднамеренно. Но это был медленный процесс, а мы стали замечать, что Леонард начинает расстраиваться и сердиться.
"Можно я попробую?" - спросила Марта. Бет взглянула на меня вопросительно, я кивнула, класс согласился с видимой неохотой, и Марта вынула свой собственный свисток (подкрепление в виде владения свистком производилось в условиях очередности). Марта отправила Леонарда назад на стартовую позицию у двери, а затем поставила стул недалеко от выключателя на расстоянии примерно фута от стены, уселась на него сама и кивнула Леонарду, чтобы он начинал. Он тотчас же кинулся к стене, где его так часто подкрепляли, следуя мимо Марты и видимо игнорируя ее новое положение. Когда он проходил мимо нее, она быстро выставила ногу, дав ему подножку.
Руки Леонарда вылетели из кармана и уперлись в стену, чтобы предотвратить падение; как только руки коснулись стены, раздался свисток. Леонард застыл. Он глядел на Марту.
Она смотрела в пространство, чтобы не давать ему никакого намека. Он начал осторожно похлопывать по стене; она это действие подкрепила. Он снова похлопал по стене и на этот раз посмотрел на то, что делает; она снова это подкрепила.
Затем мы все увидели, как Леонард внезапно посмотрел на выключатель. Все затаили дыхание. У него напряглась спина от внезапного осознания, и он включил свет. Бурные аплодисменты.
Все участвующие в обучающей игре, будь то участники или зрители, получают урок почти при каждом подкреплении. Прежде всего тренер должен уяснить, что точность времени подачи подкрепления превыше всего. Предположим, испытуемый приближается к выключателю, но в этот момент, когда тренер дает свисток, поворачивается в сторону от него. Ладно, думает тренер, я подловлю его в следующий раз. А теперь, предположим, испытуемый возвращается на стартовую позицию, затем быстро направляется в сторону выключателя и поворачивается от него. Увы! Тренер сформировал этот поворот. И все, а не только тренер, видят, насколько критично дать свисток чуть раньше, пока желаемое поведение в действительности осуществляется.
Испытуемый должен уяснить, что при этой форме обучения мозг - не помощник. Совершенно безразлично, что вы об этом думаете; если вы просто передвигаетесь, коллекционируя свистки, ваше тело поймет, что делать, без вашей помощи. Это поистине мучительный опыт для ярких интеллектуальных людей. У них имеется тенденция замирать, услышав свисток, и пытаться анализировать, что они делали.
То, что они этого не знают, и то, что их незнание ничего не значит, их шокирует. Однажды мы с моей коллегой Шери Диш обучали психолога Рональда Шустермана ходить по комнате заложив руки за спину в течение примерно минуты - довольно длительный период без подкрепления, но он был очень прилежен до тех пор, пока собравшиеся не пришли к мнению о том, что мы полностью сформулировали поведение, и не разразились аплодисментами (что является подкреплением для тренера и почти всегда возникает спонтанно). Рон, который во время своих исследований много работал с обучением животных и который опрометчиво считал, что его самого нельзя "выдрессировать", не подозревал, что его сцепленные за спиной руки являются сформированным поведением, а не просто надпороговым выражением мышления.
То, что при этом происходит, не является разновидностью макиавеллевского обучения с подкреплением, но случай привычной ошибки, когда считается, что словесная коммуникация наиболее важна и что обучение не может произойти без использования языка или по крайней мере некоего вербального осмысливания. Опыт невербального обучения особенно полезен для тех, кто использует массу словесных инструкций в своей профессиональной деятельности: учителей, терапевтов, инспекторов. Побывав "животным", вы сможете проникнуться симпатией, даже сочувствием к любому субъекту, который осуществляет формируемое вами поведение, но не отдает себе отчета, что от него ожидается, и поэтому легко впадает в ошибки. Вы сможете быть терпеливыми по отношению к животному (или ребенку, или больному), которое срывается и впадет в ярость, когда то, что он считал правильным действием, оказывается неподходящим, это непредвиденное осложнение у человеческих существ может вызвать слезы. И если вы однажды в эксперименте осуществили невербальное формирование поведения у взрослого человека, вы не будете с такой легкостью говорить при обучении и тренировке в реальной жизни, что субъект (неважно, животное или студент) "ненавидит меня", или "нарочно старается вывести меня из себя", или "глуп", или "должно быть, болен сегодня". Во время этого эксперимента, в котором каждый участвует с собственного согласия и по желанию, становится совершенно очевидно, что если что-то идет не так, то это зависит от процесса обучения, а не от того, кого обучают.
Озарение, которое возникает от этой игры у профессионалов, тоже достаточно забавно (и все остальные в тот же момент, что и вы, чувствуют ваше озарение - вы его не можете скрыть, а с другой стороны, вас окружает забавное сочувствие). Очарование игры, используемой просто как времяпровождение, состоит в том, что в нее может играть любой человек без какой-либо предварительной подготовки.
Некоторые люди обладают удивительными способностями к этому. Как показывает мой опыт, обладающие хорошей интуицией, творческие, чрезвычайно эмоциональные люди становятся большими дрессировщиками, а спокойные, наблюдательные люди - прекрасными подопытными - как раз наоборот, чем можно предположить. И,- наконец, достаточно только взглянуть на комнату, заполненную народом, поглощенным происходящим процессом формирования (действия), когда все, кроме подопытного, сидят не шелохнувшись, а тело и мозг тренера сконцентрированы на задаче, чтобы увидеть, что этот эксперимент достоин кисти художника или пера писателя: это творчество. За исключением театра, ощущение творчества редко является групповым. И уже только с одной этой точки зрения обучающая игра представляет ценность.
Мы провели несколько запоминающихся раундов обучающей игры в океанариуме "Жизнь моря", особенно запомнилась одна, в которой философ Грегори Батесон, который будучи подопытным у нескольких дрессировщиков дельфинов убедительно доказал, что его невозможно обучить, и не потому, что он стоял без движения - думал, а потому, что предлагал такое бесконечное разнообразие ответов, что просто засыпал ими дрессировщика. Другой интересный для меня раунд этой игры состоялся однажды после завтрака, на котором присутствовали шесть деловых женщин, мало знакомых друг с другом и не связанных общностью работы. После двух часов игры, в которой психотерапевт оказалась превосходным "животным", а танцовщица диско - блестящим "тренером, мы расстались, узнав друг друга много лучше и к тому же питая друг к другу большую симпатию.
В 1980 г. я вела курс экспериментальной дрессировки у группы студентов одного из колледжей в Нью-Йорке. Мы играли в обучающую игру в классе, а основное ядро, состоящее из полдюжины наделенных дьявольским воображением девиц, начали играть в обучающую игру дома между собой, работая обычно парами и формируя экзотические формы поведения, такие, как подниматься по лестнице задом наперед. В колледже их научили, с моей точки зрения, успешно, аналитическому мышлению, и они все очень тщательно продумывали как до, так и после каждого эксперимента по формированию (поведения) и энергично взялись за формирование поведения со смаком, присущим шестнадцатилетним. Они тут же принялись дрессировать родителей, применять положительное подкрепление для учителей и превращать неприятные сборища в веселые компании, избирательно подкрепляя желательное поведение. Ни до, ни после я никогда не встречала группу, с такой быстротой усвоившую как саму технику, так и ее возможности.
Ускорение процесса формирования: введение мишеней, подражание, моделирование.
Профессиональные дрессировщики используют ряд приемов, чтобы ускорить процесс формирования. Три из них, которые вам могут быть полезны, это введение мишеней, подражание и моделирование.
При введении мишеней, которые часто используются - при дрессировке морских львов и других животных, участвующих в представлениях, вы обучаете животное толкать носом мишень - скажем, кнопку на конце шеста или просто руку дрессировщика, сжатую в кулак. Затем, перемещая мишень и заставляя животное просто следовать за ней и толкать ее, вы можете получить все виды поведения, даже такие, как подъем на лестницу, прыжки или вертикальные стойки, следование за дрессировщиком, вход и выход из транспортировочной клетки и т.д. По сути дела мы используем мишень, когда хлопаем себя по бедру, подзывая собаку. Это движение, видимо, привлекает собак, а когда они приближаются, мы подкрепляем это поведение лаской. Похлопывание рукой по сидению, при приглашении кого-либо сесть рядом, тоже один из видов мишени. Группы японских туристов не теряют друг друга в толпе гораздо более высокорослых людей, следуя за флагом, который держит над толпой их гид - снова мишень. Использование для этих целей штандартов и знамен в битвах является традиционным.
Подражание в природе свойственно некоторым животным и птицам, а также людям. Молодые особи всех видов учатся большинству из того, что они должны знать, наблюдая, а затем копируя поведение старших. В то время как психологи часто считают "обучение при помощи наблюдения" признаком разумности животного - у приматов оно хорошо выражено, у некоторых других животных плохо, - я думаю, что наличие или отсутствие этой способности у того или иного вида зависит от его экологии, т.е. ее роли в естественных условиях жизни, а не разума как такового. У некоторых птиц способность подражать поведению выражена чрезвычайно сильно. В Англии синицы выучились открывать оставляемые у дверей молочные бутылки, доставать из них сливки, этот навык с помощью подражания с такой быстротой распространился, что крышки молочных бутылок пришлось переделывать.
Собаки мало способны к обучению при наблюдении; когда они делают то же, что и другие собаки, то обычно это потому, что отвечают на одни и те же стимулы, а не потому, что подражают. С другой стороны, кошки, которые, согласно мнению зоопсихологов, имеют более низкий уровень умственных способностей, прекрасные подражатели. Выражение "сорусаt" неслучайно. Если вы обучаете какому-либо трюку - скажем, звонить в колокольчик, чтобы пустили в дом, одну из кошек в доме, то и другие кошки вполне могут этому научиться без вашего обучения. Кошки могут даже подражать другим видам. Однажды вечером моя дочь в течение часа обучала своего пуделя сидеть на детском кресле-качалке и раскачиваться, используя в качестве подкрепления мелко нарезанную ветчину. Одна из кошек за этим наблюдала.
Когда урок окончился, кошка по собственному почину вскочила на кресло и стала его раскачивать по всем правилам, поглядывая на нас в ожидании своей доли ветчины, которая конечно же была честно заработана.
Я думаю, что эта сильно выраженная тенденция к подражанию объясняет, почему кошки не могут спускаться с деревьев. Лазанье вверх происходит более или менее автоматически: оно, как говорят биологи, является поведением с "жесткими связями". Когти при этом выпускаются, и кошка взбегает по дереву. Однако, чтобы спуститься вниз, кошке следует двигаться хвостом вперед, при этом загнутые вниз - когти тоже могут сослужить службу, но это, вероятно, навык, требующий обучения, или поведение с "гибкими связями" Я могу утверждать, потому что мне лично (посреди ночи, стоя на верхушке приставной лестницы) пришлось обучать кошку спускаться с дерева хвостом вперед. Я сделала это, чтобы в будущем избавить себя от горестных воплей застрявшей на дереве кошки, и действительно сформированное поведение сохранилось - она никогда больше не застревала на деревьях (хотя продолжала на них взбираться). Я думаю, что в природе кошки учатся тому, как поворачиваться и спускаться хвостом вперед, от своих матерей, лазая вместе с ними по деревьям, но поскольку мы их отнимаем от матерей в таком нежном возрасте - шесть-восемь недель, - эта возможность обучения через копирование утрачивается.
Дельфины обладают выраженной тенденцией подражать друг другу, что облегчает процесс дрессировки. Чтобы получить выполнение одного и того же действия несколькими дельфинами, вы можете сформировать поведение у одного из них, а затем давать подкрепление другим за каждую попытку подражать. В неволе детеныши дельфинов часто разучивают трюки взрослых задолго до того как сами дорастут до подкрепления рыбой, и во многих океанариумах накопился опыт обучения "дублеров" - животных, непосредственно не задействованных, но наблюдающих за другими, участвующими в представлении. Было доказано, что они выучивали типы поведения, требуемые для представления, даже не получая за их выполнение подкрепления. Очевидно, для диких дельфинов возможность подражать своим сородичам-дельфинам должна быть важна для выживания.
Мы можем и должны использовать подражание, когда для этого представляется возможность, при обучении людей физическим навыкам - танцам, катанию на лыжах, теннису и т.д. Человеку, показывающему действия, лучше стоять рядом или спиной к обучаемым, так, чтобы они могли следовать за его движениями, не выполняя каких-либо умственных преобразований. Чем меньше требуется разъяснений и чем меньше используется словесных описаний, тем лучше пойдет подражание. В некоторых случаях, если вы хотите обучить навыку, выполняемому правой рукой (скажем, вязанию) левшу, вы должны сесть к нему или к ней лицом и таким способом добиться, чтобы, подражая вам, обучающийся выполнял движения, являющиеся зеркальным отражением ваших.
Конечно, большая часть сформированного поведения наших детей обязана своим происхождением подражанию. Они видели, что и как мы делаем, то и делают сами, как в хорошем, так и в плохом. Не так давно утром на почте трое маленьких детей устроили такую свалку, что с трудом можно было слышать что-либо кроме этого шума. Их мать, стоявшая в очереди, несколько раз громко кричала, прежде чем ей удалось усмирить их и призвать к тишине. "А как бы вы заставили детей вести себя тихо?" - спросила она работницу почты. "Постарайтесь сами говорить тише", - справедливо ответила почтальон. Обозреватель Юдифь Мартин ("Мисс Манеры") считает, что когда обучаешь хорошим манерам детей, то в течение всего периода обучения - "от рождения до свадьбы" - все в доме должны есть аккуратно, разговаривать вежливо и по крайней мере проявлять хотя бы видимость интереса к делам и словам других.
Третий прием ускорения формирования - моделирование - (лепка) состоит в том, чтобы заставить обучающегося выполнять пассивно (двигать им как марионеткой) действие, которое должно быть разучено. Игроки в гольф проделывают это, когда обхватывают рукой новичка сзади, берутся за клюшку и делают клюшкой, находящейся в руке обучаемого, нужный замах. Некоторые из исследователей, которые обучали обезьян знаковому языку, применяли моделирование очень широко. Обучающий держит руки молодого шимпанзе и кладет их нужным образом или делает нужное движение; в конце концов обезьяна запоминает их и будет выполнять спонтанно. Моделирование составляло секрет "живых статуй" - циркового представления, очень популярного на грани нынешнего и прошлого веков, в которой люди и лошади принимали позы знаменитых произведений живописи и скульптуры, - на публику производила впечатление эта неподвижность. Когда загорался свет, возникали картины типа войск Наполеона при Ватерлоо, застывшие в своем движении, причем не только люди, но и лошади с шеями, изогнутыми дугой, с передними ногами, поднятыми в воздух, как будто окаменевшие. Мне говорили, что это достигалось с помощью массирования лошадей в течение нескольких часов, пока они совершенно не расслаблялись, и тогда, как глине, им придавали нужные позы, подкрепляя удержание этих поз.
Я всегда несколько сомневаюсь в отношении применения моделирования как методики обучения, несмотря на то, что оно широко используется. Пока субъект не начнет выполнять какие-либо действия или по крайней мере не делает попыток их выполнять без того, чтобы его поддерживали, подталкивали или двигали им, я не уверена, что происходит какое-либо значительное обучение. Часто все, чему субъект при этом обучается, - это позволит вам им манипулировать: собака, которую учат подносить дичь, обучится разрешать вам держать закрытым ее рот, когда в нем поноска, но, когда вы его отпустите, она ее бросит; начинающий ходить ребенок, будучи посажен на высокий стульчик, сидит на нем спокойно до тех пор, пока удерживаете его, но поднимается и начинает вылезать, как только вы отпустите руку. В данном случае обучается тот, кто лепит поведение, - обучается держать или вести в течение все более и более длительного времени.
Существует мнение, что если производить с субъектом одно и то же действие в течение длительного времени или достаточно часто, то в конце концов он усвоит, как действовать. Иногда это так, но в действительности может пройти очень много времени, а на пути от подталкивания до самостоятельного выполнения необходимо озарение: "Ага! Они хотят, чтобы я делал это сам". Это слишком высокий спрос с животного. И даже если ваш подопытный своего рода Эйнштейн, повторение в надежде на то, что блеснет озарение, является бесплодной тратой ценного дрессировочного времени. Чтобы моделирование работало, его надо сочетать с формированием поведения. Когда вы ставите субъекта в определенную ситуацию или вынуждаете производить движения, вы откликаетесь на его малейшую попытку начать нужное движение, и эту попытку вы подкрепляете. Челюсти собаки хотя бы слабо сомкнулись на поноске, замах игрока в гольф стал более плавным, руки молодого шимпанзе сами по себе пришли в движение, и вы поощряете этот момент.
Кроме того, вы можете сформировать новый навык при уменьшении моделирующих влияний. Комбинация моделирования и выработки часто оказывается очень эффективным способом обучения какому-либо поведению, но при этом работает комбинация, а не одно моделирование.
Особые ученики
Можно формировать поведение почти любого существа.
Психологи обучали крошечных детей движением руки гасить и зажигать свет в комнате. Можно обучать птиц. Можно формировать поведение рыб. Однажды я обучала большого краба-отшельника звонить в колокольчик, собирающий к обеду, дергая клешней за шнурок. (Фокус заключался в том, чтобы дать крабу пищу в тот момент, когда клешня, двигающаяся бесцельно, коснется шнурка. Я пользовалась длинным анатомическим Пинцетом, чтобы подносить кусочки креветки прямо к его челюстям.) Профессор Гарвардского университета Рихард Хернетейн рассказывал, что однажды он обучал морского гребешка хлопать любят хвастаться что они могут обучить любое животное выполнить любое действие, для которого у него имеются физические и умственные возможности, и насколько мне известно, это так и есть.
Одним из результатов занятий по формированию поведения, особенно если они приносят обучаемому успех, является увеличение продолжительности удерживания внимания; фактически вы формируете продолжительность участия. Однако некоторые организмы, как и следует ожидать, не обладают способностью к длительному удерживанию внимания. От незрелых организмов - щенков, жеребят, детей - никогда нельзя требовать более трех-четырех повторений данного действия, попытки выжать что-либо сверх этого могут отбить охоту или испугать. Это не значит, что незрелые организмы не могут обучаться. Они учатся все время, но короткими периодами.
Один знакомый капитан рыболовного судна обучал свою четырехмесячную внучку выполнять просьбу "Дай пять!", и то, как малыш с энтузиазмом шлепал своей ладошкой по его лапе, наподобие приветствия музыкантов джаза, никогда не оставляло зрителей равнодушными. Но он добился этого несколькими, почти моментальными "уроками".
Но биологические объекты вынуждены обучаться не только в детстве. Некоторые типы поведения одним видам даются с легкостью, а другим они трудны. Свиньям, например, по-видимому, трудно переносить что-либо во рту, но они с легкостью обучаются толкать предмет пятачками. Большинство пород собак выведено, по-видимому, с определенными поведенческими тенденциями: вряд ли кому-либо потребуется обучать колли пасти овец, так как необходимое поведение уже установлено и даже усилено с помощью отбора; но вы зададите себе трудную задачу, если решите научить пасти овец бассета. Некоторым навыкам гораздо легче обучиться на определенных этапах развития; детеныша мангуста можно приручить и превратить в восхитительное домашнее животное в возрасте шести недель, но не позже. Обычно считается, что люди усваивают языки легче в детском возрасте, нежели во взрослом, хотя лингвисты недавно обнаружили, что взрослые, которые хотят работать, могут, вероятно, выучить новый язык быстрее, чем большинство детей и подростков. Поведением, которому, я думаю, действительно очень трудно обучиться взрослым людям, является плавание. Мы являемся одним из тех немногочисленных видов, для которых плавание не является естественным, и хотя вы можете обучить взрослого держаться на воде и делать правильные движения, я никогда не видела, чтоб кто-либо мог резвиться и хорошо чувствовать себя на глубине, если не был обучен плаванию в детстве.
А как насчет того, чтобы формировать свое поведение?
Существуют всевозможные программы изменения собственного поведения: бросаем курить, следим за своим весом и т.д. Большинство этих программ опирается в основном на метод формирования поведения, обычно называемый модификациями поведения, они могут быть или не быть успешными. Трудность, как мне кажется, состоит в том, что вы должны сами себе давать подкрепление. Но когда вы подкрепляете сами себя, исчезает элемент неожиданности - ученик всегда знает, чего стоит тренер. При этом очень просто сказать: "Черт с ней, с еще одной звездочкой в моей карточке, я лучше выкурю сигарету".
Доказано, что любая программа самовоспитания может служить лишь некоторым людям. Другие могут добиться успеха, только попробовав три или четыре различные программы или после нескольких повторений данного метода. Фактически такие люди могут успешно изменить свою привычку или покончить с пристрастием, но вряд ли это получится с первого раза. Некоторым может в значительной мере помочь внушение или самовнушение. Редактор одного крупного издательства рассказывал мне, что он смог избавиться от очень сильной привычки к курению, научившись от гипнотизера способности впадать в легкий транс с помощью самовнушения и повторять как заклинание фразу вроде "Я не хочу курить" всякий раз, когда он чувствовал непреодолимое желание взять сигарету. По его представлению этот прием "создавал завесу" между ним и сигаретой; облегчение и поздравление себя с победой, когда желание проходило, служило подкреплением. Возможно, такие методы самовнушения привлекают к работе тренера подсознание, что позволяет несколько отделиться от самого субъекта, который представлен сознательной сферой, и тем самым сделать как отрицательное, так и положительное подкрепление более эффективным.
Во время написания этой книги я из любопытства опробовала несколько формальных программ формирования поведения: две, направленные на групповое обучение, и две программы самоусовершенствования, направленные на то, чтобы бросить курить, обучиться медитации, следить за весом и правильно тратить деньги. Все они были умеренно успешными, но не всегда сразу; некоторые начинали давать результаты только примерно через год. Я обнаружила, что единственным наиболее успешным приемом самоподкрепления является постоянная регистрация результатов, которая может быть использована во всех четырех программах.
Нужно было вести регистрацию так, чтобы улучшение было видно сразу. Я использовала графики. С их помощью моя виновность за упущения могла уменьшаться при взгляде на график, на котором было видно, что несмотря ни на что я сейчас нахожусь на более высоком уровне, чем шесть месяцев тому назад. Еще, может быть, далеко до совершенства, но "кривая", или наклонная линия, графика шла в нужном направлении, и это является зримым доказательством улучшения; и хотя это само по себе является слабым, медленно действующим подкреплением, оно создает достаточную мотивацию, чтобы продолжать мои занятия.
Одним из видов формирования собственного поведения, который прекрасно работает, является обучение с помощью компьютера. В программу компьютера могут быть заложены забавные подкрепления, и вследствие этого обучение идет быстро и весело. Оно становится многообещающим применением законов положительного подкрепления.
Выработка поведения без помощи слов.
В обычных ситуациях обучения, таких, как уроки тенниса, субъект знает, что ее или его обучают, и обычно охотно включается в этот процесс. Поэтому вам не обязательно дожидаться нужной реакции и подкреплять ее. Вы можете без особого вреда словами направлять поведение: "Делай так. Хорошо. Теперь повтори дважды. Хорошо". Однако в нестандартных ситуациях лучше обойтись без инструкций и (словесных) обсуждений. Предположим, ваш сосед по комнате - неряха, который повсюду разбрасывает грязную одежду, а словесные внушения - выговоры, просьбы - все остается без результатов. Можно ли выработать аккуратность?
Возможно.
Конечно, вы должны наметить план выработки, начальный и промежуточные ходы, при помощи которых вы достигнете желаемой цели. Например, чтобы грязное белье каждый раз клалось в корзину, вы можете начать с одного носка и в один прекрасный день "направить" поведение, открыв крышку корзины и сделав так, что носок вот-вот выпадет на пол. Подкрепление может быть словесное, тактильное или любое другое, которое, как вам кажется, скорее всего найдет отклик или будет благосклонно принято вашим соседом. Люди не глупы, они изменяют свое поведение, чтобы получить подкрепление. Даже если раскидывание грязных вещей является своеобразным актом агрессии в отношении вас ("Собери мою одежду, пижон!"), используя положительное подкрепление, вы можете получить устойчивый и зримый процесс в сторону, которую вы считаете приемлемым уровнем аккуратности.
Однако в использовании процесса формирования существуют две ловушки. Первая состоит в том, что легче заметить ошибки, чем улучшение, и поэтому для таких вербальных существ, каковыми являемся мы, гораздо проще негодовать, когда критерий не достигнут, чем давать подкрепление, когда он достигнут. И это может свести на нет прогресс.
Вторая опасность состоит в том, что если вы предполагаете сформировать чье-либо поведение, то очень заманчиво поболтать об этом. А такие разговоры - могут все разрушить. Если вы говорите: "Ты получишь награду" - за то, что положил белье в корзину, не куришь марихуану, тратишь меньше денег или за что-либо другое, - вы лишь совершаете подкуп или даете обещание, а не истинное подкрепление; при обучении, идущем по вашему плану, человек может иногда ему противиться и нарочно поступать не так как нужно. Чтобы добиться результатов, надо осуществлять формирование поведения, а не говорить о нем.
А если вам удалось сформировать чье-либо поведение, то в дальнейшем также лучше этим не хвастаться. Некоторые этого совершенно не понимают и постоянно подчеркивают свою роль - в лучшем случае это проявляется в опеке, а это лучший способ нажить себе в лице субъекта врага на всю жизнь. Кроме того, если вы помогли кому-то улучшить какой-либо навык или избавиться от плохой привычки, меняя в качестве подкрепления собственное поведение, на кого падает основная тяжесть работы? На субъекта. Умные родители никогда не раззванивают повсюду о том благе, которое они совершили, воспитывая своих, детей. Во-первых, мы все знаем, что эта работа никогда не кончается, а во-вторых, дети заслуживают похвалы - хотя бы за то, что выдерживают все педагогические ошибки, которые мы совершаем.
Так как формирование поведения людей может или даже должно происходить в несловесной форме, то некоторые воспринимают это как своего рода злонамеренные манипуляции. Мне кажется, что это не от недопонимания. Причина того, что формирование должно быть невербальным, состоит в том, что мы имеем дело с поведением, а не с идеями, и не только с чьим-нибудь поведением, но и со своим собственным.
Однако поскольку вы можете формировать поведение людей без того, чтобы то, что вы делаете, доходило до их сознания, и поскольку, не имея формального согласия на то, чтобы быть обученным, как это бывает при уроках игры в теннис, вы едва ли не обязаны формировать людское поведение на невербальном уровне, то не возникает ли возможность заставлять людей совершать ужасные вещи?
Конечно, да, особенно если вы в качестве отрицательного подкрепления используете такие резко неприятные стимулы, которые вызывают истинный страх и даже ужас. В лабораторных условиях психологи обнаружили феномен названный "выученная беспомощность". Если животное обучено избегать неприятного стимула, такого как удар электрического тока, при помощи нажима на рычаг или перемещения в другую часть клетки, где нет абсолютно никаких способов избежать удара тока, оно постепенно прекращает все попытки отделаться от неприятности. Оно становится полностью податливым и пассивным, и может даже лежать и получать наказания даже тогда, когда снова появляется путь к свободе. Аналогом этого феномена у людей возможно является "промывание мозгов". Если человек подвергается строгой изоляции и неизбывному страху или боли, и если неприятные стимулы в последующем используются в качестве отрицательного подкрепления, то в тех случаях, когда человек может избегнуть или прекратить их действие, изменив поведение, - ну, тогда... животные обычно погибают, а люди оказываются более стойкими, и некоторые начинают делать все что угодно, чтоб избежать отрицательного подкрепления.
Фотографии заложницы, держащей автомат при ограблении банка, тому доказательство. Но так как захватившим ее в плен не понадобилось никакой книги о том, как этого добиться, то не лучше ли каждому из нас в качестве защиты от таких происшествий понимать, как действуют законы формирования поведения?
III. УПРАВЛЕНИЕ С ПОМОЩЬЮ СТИМУЛОВ.
Взаимодействие без принуждения.
Все, что вызывает какую-либо поведенческую реакцию, называется стимулом. Некоторые стимулы способны вызывать реакции без какого-либо обучения или тренировки: мы вздрагиваем от громкого звука, моргаем от яркого света, нас тянет в кухню, когда до нас доносится аппетитный запах; животные поступают точно так же. Такие звуки, свет и запахи называются безусловными, или первичными, стимулами.
Другие стимулы заучиваются благодаря ассоциации. Сами по себе они могут ничего не значить, но становятся выделяемыми сигналами для поведения; сигналы светофора заставляют нас стоять или идти, мы вскакиваем, чтобы снять трубку зазвонившего телефона, на шумной улице оборачиваемся, услышав свое имя и т.д., и т.д. Ежедневно мы отвечаем на множество выученных сигналов. Они называются условными, или вторичными, стимулами.
При формальном тренинге львиная доля усилий приходится на образование условных сигналов. Сержант, занимающийся строевой подготовкой со взводом новобранцев, и хозяин собаки на дрессировочной площадке в равной-мере стремятся сделать в основном так, чтобы обучающиеся повиновались командам, которые в действительности являются условными сигналами. Фокус не в том, что собака может сидеть, а человек останавливаться, фокус в том, что это делается четко и по команде. Вот что мы называем повиновением - не просто выполнение действия, но гарантия того, что оно будет выполнено по сигналу. Психологи называют это "поставить поведение под контроль стимулов". Это вырабатывается с трудом, выработка основывается на правилах, а правила нуждаются в проверке.
А что, если у вас нет в мыслях становиться хозяином собаки и вы не собираетесь тренировать спортивную команду?
Вам все равно может пригодиться понимание того, что такое стимульный контроль. Например, если ваши дети бездельничают и не идут на ваш зов, вы плохо владеете стимульным контролем. Если вы руководите людьми и вам иногда приходится два или три раза повторять - приказ или инструкцию, прежде чем они будут выполнены, то значит у вас проблемы со стимульным контролем. Разве не случается, что вы говорите: "Я тебе уже однажды сказала, я говорила тебе тысячу раз, не..." (Не хлопай дверью, или не клади мокрый купальник на кровать, или что-либо в этом роде.) Когда сказать один или тысячу раз недостаточно, поведение не управляется стимулами.
Иногда может казаться, что мы обладаем стимульным контролем когда в действительности этого нет. Мы предполагаем, что сигналу или команде должны подчиниться, а этого не происходит. Самой распространенной реакцией на это является усиление сигнала. Так, официант не понимает вашего французского? Говорите громче. Чаще всего это не помогает. Субъект должен распознавать сигнал, иначе безразлично, кричите ли вы что есть мочи или даже ревете с помощью усилительной аппаратуры рок-ансамбля, на вас будут смотреть невидящим взором.
Другой реакцией человека на игнорирование условного сигнала является бешенство, которое действует только в том случае, если субъект проявляет преднамеренное непослушание, не давая твердо заученного ответа на хорошо выученный сигнал. При этом иногда, показав характер, можно получить хорошее поведение.
Бывает, что субъект отвечает правильно, но с очень большой задержкой или через пень-колоду. Часто неуклюжие ответы на команды определяются тем, что субъект не обучен отвечать быстро. Без положительного подкрепления не только за правильный, но и за проворный ответ на сигнал у субъекта нет шансов усвоить, что успех приносит быстрое повиновение стимулам. При этом поведение в действительности не контролируется стимулами.
Реальная жизнь изобилует плохой организацией управления с помощью стимулов. Как только один человек пытается проявить власть, другой оказывается в опасности проявить "непослушание" В действительности проблема состоит в непонимании команд или сигналов, которым он поэтому не может повиноваться Это примеры плохой коммуникации или нечеткого управления с помощью стимулов.
Правила управления с помощью стимулов.
Для того, чтобы управлять с помощью сигналов, надо сформировать нужное поведение, а затем, когда оно осуществляется, делать так, чтобы оно происходило во время или сразу после какого-либо определенного сигнала. Этот стимул затем становится ключом, или сигналом, поведения.
Например, предположим, что вы заставляете собаку садиться, надавливая на крестец и подтягивая за ошейник. Это безусловные стимулы, они действуют без обучения. Затем вы подкрепляете любое самостоятельное проявление собакой этой позы, формируя соответствующее поведение. Делая это, вы произносите команду "Сидеть!", которая первоначально ничего не значит для собаки (конечно, подойдет и любое другое слово на любом языке). Когда собака усвоит, что вам иногда надо, чтобы она села, она иногда станет выполнять это действие во время или после предъявления сигнала, или условного стимула, команды "Сидеть!". В конце концов она начнет выполнять действие точно в соответствии с тем, что ей приказывают.
Теперь поведение находится под контролем стимула, не так ли? Еще нет. Проделана только половина работы. Животное следует также обучить - и это специальная тренировочная задача - не садиться без команды. Установление управления поведением стимулами не является завершенным, пока оно совершается и в отсутствии условного сигнала.
Это, конечно, не означает, что собака должна целый день стоять, пока вы не скомандуете: "Сидеть!". Она может садиться сколько ей вздумается. Однако во время тренировок или работы, когда предполагается использование условных стимулов, "пуск" и "стоп" сигналы должны быть твердо установлены, чтобы выполнение команды было надежным.
Итак, полный контроль с помощью стимулов определяется четырьмя условиями, к каждому из которых следует относиться как к самостоятельному разделу тренировочной задачи, самостоятельному пункту программы выработки.
Поведение всегда осуществляется сразу после подачи условного стимула(собака садится, "когда ей приказывают).
Поведение никогда не возникает в отсутствие стимула(во время занятий или работы собака никогда не садится спонтанно).
Поведение никогда не наблюдается в ответ на другие стимулы (если вы говорите: "Лежать!", собака не должна садиться).
Никакое другое поведение не возникает в ответ на данный стимул (когда вы говорите. "Сидеть!" собака не должна ложиться или скакать и лизать ваше лицо)
Только когда все четыре условия соблюдаются, собака действительно полностью и окончательно понимает команду "Сидеть!". Теперь вы действительно управляете ею с помощью стимула.
Где в реальной жизни мы используем или нуждаемся в таком полном управлении с помощью стимулов. Ну к примеру, в музыке. Дирижеры оркестра часто создают очень сложную систему сигнального управления, а на репетиции дирижер может встретиться с самыми разнообразными неправильными реакциями. Например, он может дать сигнал означающий одно, - скажем, "форте", усиление звучания и не получить его, может быть, вследствие того что еще недостаточно прочно установлено значение сигнала. Или он может и не давать сигнала усиления, а тем не менее получить слишком большую интенсивность звука. Особенно этим отличаются духовые инструменты классических оркестров, Рихард Штраус в юмористическом своде правил для начинающих дирижеров говорил: "Никогда не подбадривайте взглядом играющих на духовых инструментах" Дирижер может дать сигнал, требующий другого, - допустим, "престо" а вместо увеличения темпа получить усиление звучания солисты теноры проделывают это весьма часто Наконец, дирижер может требовать включения большего числа исполнителей, а вместо этого получить множество ошибок, так происходит с хористами-любителями. Каждый тип неправильного ответа на условный стимул должен быть исправлен с помощью тренировки, прежде чем дирижер будет уверен, что у него или у нее адекватное сигнальное управление.
Так же жизненно важно сигнальное управление в военном деле. Занятия по строевой подготовке с новобранцами - утомительное и трудоемкое дело, и им самим оно может казаться трудным и бессмысленным, но оно выполняет очень важную функцию. Строевая подготовка не только вырабатывает точные реакции на строевые команды, что даст возможность командирам с легкостью приводить в движение большие группы людей, но она также вырабатывает навык ответа на условный сигнал вообще: повиновение команде, которое в конце концов является не столько умственным актом, сколько выученным умением, являющимся решающим, а часто и жизненно важным для солдата. С тех пор как были придуманы армии, строевая подготовка являлась способом выработки этого навыка.
Что может быть сигналом?
Условным стимулом - выученным сигналом может быть все, абсолютно все, что может быть воспринято. Флаги, свет, слова, прикосновения, вибрация, хлопки пробок шампанского - короче говоря, безразлично, какой сигнал вы используете Коль скоро субъект может воспринимать его, сигнал может быть использован для вызова выученного поведения.
Дельфинов обычно тренируют с помощью воспринимаемых зрением сигналов, руки, но я знаю одного слепого дельфина, который выучил много разных типов поведения в ответ на различные прикосновения. Пастушьих собак обычно дрессируют с помощью сигналов, поданных рукой и голосом. Однако в Новой Зеландии с ее широкими просторами, где собака может находиться очень далеко, в качестве условного сигнала используют пронзительные свистки, которые слышны на большем расстоянии, чем голос. Когда новозеландский пастух продает такую собаку, покупателем может оказаться человек, живущий за много миль; так как свистки невозможно записать на бумаге, то старый хозяин обучает нового командам по телефону.
У рыб можно выработать условный рефлекс на звуки или свет - мы все знаем, как аквариумные рыбки устремляются к поверхности, если постучать по стеклу или включить свет. А человеческие существа могут выработать условные связи практически на все что угодно.
В тренировочной ситуации полезно, чтобы для всех субъектов были одни и те же ключи и сигналы, чтобы не только дрессировщик, но и другие люди могли вызывать данное поведение. Поэтому дрессировщики склонны строго следовать традициям в использовании условных стимулов. Во всем мире лошади под седлом начинают движение, когда вы толкаете их пятками в бока, и останавливаются, когда вы натягиваете поводья. Верблюды в зоопарке Бронц ложатся, когда слышат команду "Каш!", даже если рядом с ними никого нет, включая их дрессировщика, говорящего по-арабски; и любой человек знает, что надо сказать, чтобы верблюд лег.
И то, что живущих в Нью-Йорке верблюдов можно с тем же успехом обучить ложиться при словах "Спокойно, крошка!", не имеет ни малейшего значения.
Поэтому-то профессиональные дрессировщики не могут понять, что многие условные стимулы выбраны произвольно. Однажды в платной конюшне я работала с молодой лошадью на корде, обучая ее команде "Вперед!". Тренер конюшни смотрел на это с отвращением и наконец сказал: "Так ничего не выйдет - лошади не понимают "Вперед!", надо цокать". Потом взял веревку у меня из рук, сказал: "Тцо-тцо" и стеганул жеребенка по крупу свободным концов веревки, что естественно тотчас же вызвало движение вперед.
"Понятно?" - сказал он, считая свои слова доказанными.
Я поняла. С тех пор, воспитывая моих пони, я обучала их слушаться не только моих команд, но и любой возможной системы понуканий, окриков, применяемой другими дрессировщиками. Это избавило меня от неприятностей и заставило говорить обо мне как о подающем надежды дрессировщике-любителе. По крайней мере мне не приходилось переделывать моих сигналов!
Обучить пони двум системам команд не только возможно, но и легко. В то время, как на каждый отдельный сигнал вам надо получать только какое-либо одно поведение, вполне достижимо получение одного и того же поведения на несколько условных сигналов. Например, в переполненном людьми помещении оратор может потребовать тишины, воскликнув: "Тихо!", или встать и, подняв руку, жестом призвать к молчанию.
А если присутствующие шумят и при этом находятся в некотором подпитии и, следовательно, отличаются рассеянным вниманием, поможет позвякивание ложкой по стакану. Мы все обучены осуществлять данное поведение в ответ на любой из, по крайней мере, трех этих стимулов.
Введение второго условного стимула для выученного поведения называется переносом стимулов. Чтобы добиться переноса, вы предъявляете старый стимул - допустим, команду, поданную голосом, - как всегда, и новую команду - скажем, сигнал, поданный рукой, - и подкрепляете ответ; затем постепенно делаете старый стимул все менее и менее заметным и одновременно привлекаете внимание к новому, делая его очень выраженным, пока на новый стимул не будете получать столь же хороший ответ, даже тогда, когда старый стимул не предъявляется вовсе. Обычно этот процесс идет несколько быстрее, чем выработка ответа на первоначальный стимул; когда уже выработано "Выполняй это действие" и "Выполняй это действие по команде", то легче выработать "Выполняй это действие также по другой команде".
Интенсивность сигнала и стирание стимулов
Не существует определенных требований к интенсивности и величине условного сигнала, вызывающего ответ. Первичные, или безусловные, стимулы, дают градуальный ответ в зависимости от интенсивности: реакция на резкий, колющий удар сильнее, чем на булавочный укол, и чем громче внезапный шум, тем сильнее мы вздрогнем. Однако условному стимулу достаточно быть узнаным, чтобы вызвать полный ответ. Вы видите красный свет и останавливаете машину; быстрее или медленнее вы это делаете не зависит от размера светофора. До тех пор, пока вы распознаете сигнал, вы знаете, что делать. Поэтому, как только стимул заучен, возможно не только получить его перенос, но также постепенно его уменьшать, пока он не станет едва различим, но попрежнему будет давать те же результаты. Возможен случай, когда вы можете получать результаты при таких слабых сигналах, которые не видны постороннему глазу. Это называется "стирание" стимулов.
Мы пользуемся стиранием постоянно: то, что поначалу должно быть очень массированным стимулом ("Дик, нельзя сыпать песок на головы другим детям", - говорим мы, вытаскивая Дика из песочниц), со временем превращается в чуть заметный сигнал (просто поднять брови иди погрозить пальцем). Дрессировщики животных иногда добиваются поразительных, просто волшебных результатов с помощью стертых стимулов. Один из самых забавных номеров, которые я видела, проделывал попугай в Парке диких животных в Сан-Диего. Он разражался истерическим хохотом в ответ на чуть заметное движение руки дрессировщика. Представьте себе возможности этого трюка: "Педро, что ты думаешь о шляпе этого человека?" - "Ха-ха-ха!". Поскольку публика не замечает сигнал, единственное выученное попугаем поведение кажется результатом разумного сардонически-язвительного ответа на вопрос; а на самом деле это был четкий ответ на очень ослабленный стимул, а сардонический ум, если и присутствовал, то принадлежал дрессировщику, а может быть, сценаристу.
Однако лучшие примеры обусловливания, стирания и переноса стимулов мне приходилось наблюдать не в мире дрессированных животных, а на репетициях симфонических оркестров. Будучи певцом-любителем, я занималась в нескольких оперных и симфонических хорах, которые часто управлялись заезжими дирижерами. В то время как многие из сигналов, которые подают дирижеры музыкантам, являются более или менее стандартизованными, у каждого из дирижеров есть свои собственные сигналы, и их значение должно быть усвоено в очень короткое время - время на репетицию часто лишь немногим превосходит время на выступление. Однажды на репетиции симфонии Малера "Воскрешение", как раз в тот момент, когда басы собирались вступить с обычной оглушительной силой, я увидела, как дирижер предъявил безусловный сигнал, предупреждавший: "Вступайте мягче", изобразив на лице страшную тревогу, пригнувшись к земле и заслонив лицо рукой, как бы защищаясь от удара. Все поняли смысл переданного сообщения, и в следующие несколько минут дирижер смог ослабить сигнал и уменьшить интенсивность звучания всех частей хора с помощью предостерегающего взгляда, легкого движения спины, имитирующего припадание к земле, или чуть заметного отголоска от прежнего жеста, и наконец, только вздрагивание плеч. Столь же часто дирижеры осуществляют перенос стимулов, сочетая какой-либо известный или самоочевидный жест - скажем, - поднятие ладони кверху для обозначения "Громче" - с незнакомым жестом, таким, как присущий только ему наклон головы или поворот тела - однажды, сидя слева от дирижера среди альтов, я наблюдала дирижерский жест, управляющий громкостью звучания альтов с помощью левой брови.
Одним из результатов введения управления с помощью стимулов является усиление внимания субъекта, необходимое, если он хочет получить подкрепление за правильный ответ, особенно, если стимулы подвергаются стиранию. Бывает, что субъект способен воспринять столь слабые сигналы, в которых не отдает себе отчета сам дрессировщик, подающий их. Классический пример этого - Умный Ганс, лошадь, живущая в Германии. Это было в начале века; ее считали гениальной. Ударами копыт она могла считать, производить арифметические действия, складывать из букв слова и даже извлекать квадратные корни; правильные ответы, конечно, подкреплялись лакомством. Хозяин, в прошлом школьный учитель, был совершенно уверен, что обучил лошадь читать, думать, заниматься математикой и вступать в общение. И действительно лошадь "отвечала" на вопросы даже в отсутствие хозяина. Многие ученые мужи приезжали в Берлин изучать Умного Ганса и убеждались в его гениальности. И лишь одному из психологов удалось показать, что лошадь ориентируется на какой-то сигнал, и, если никто из присутствующих не знает ответа, удары копыта носят неопределенный характер. Потребовалось длительное время и дальнейшее исследование, против которого восставали те, кто был убежден в гениальности лошади; чтобы показать, что сигналом к прекращению ударов копыта был легкий подъем головы хозяина или любого другого человека, задающего вопрос, когда достигалось правильное число, это движение, первоначально усиливаемое широкополой шляпой, которую носил учитель, теперь было столь малым, что его почти не было видно (никому, кроме Умного Ганса), но оно почти не поддавалось подавлению произвольным усилием. Вот поэтому лошадь могла ориентироваться, когда прекращать удары копытом, наблюдая за любым человеком, а не только за хозяином. Феномен Умного Ганса стал нарицательным для любого случая, когда внешне поразительное поведение, начиная от разума животного, кончая психическими явлениями, на самом деле управляется какими-либо мельчайшими или стертыми проявлениями поведения экспериментатора, ставшими условными стимулами для субъекта.
Условные стимулы, вызывающие отвращение.
Единственным случаем, где сила условного стимула, по-видимому, имеет значение, является обычно дрессировка домашних животных - рывок за поводья или привязь, легкий удар по бокам лошади - все это размытый вариант первоначального безусловного стимула, резкого рывка или толчка, сильного удара рукой, которые вызывают ответ, не требующий обучения. Поэтому, если слабый стимул не действует, создается впечатление, что ответ возрастает, если вы усилите стимул. Однако попытки осуществить это на практике встречают большие затруднения.
Выученные сигналы и первоначальные стимулы совершенно различны по своей природе, а новички обычно это не учитывают. Если они не получают ответа, скажем, на легкий рывок, они дергают чуть сильнее, затем еще немного сильнее, и все совершенно без пользы, так как лошадь или собака с той же возрастающей силой тянут в другую сторону.
Профессиональные дрессировщики имеют обыкновение работать над сигналом и применять силу раздельно; они дают условный стимул, и если животное ему не повинуется, они, минуя все градации, немедленно вызывают нужное поведение чрезвычайно сильным неприятным стимулом, способным "освежить память", как выражается один дрессировщик лошадей. Такую же функцию выполняет парфорс в дрессировке собак. При умении даже небольшой человек, используя такой ошейник, может добиться такого рывка, который будет достаточен, чтобы свалить с ног датского дога.
Имея в запасе эти первичные стимулы, можно быстро получить хороший ответ на очень слабые рывки, и, как замечает английская дрессировщица Барбара Вудхаус, это в конечном счете гораздо лучше, чем постоянно дергать и тянуть за шею бедное животное к каким-то промежуточным и бессмысленным целям.
Время отставления.
Чтобы добиться точности ответа на условный стимул, полезно применять прием ограничения времени отставления.
Допустим, ваш подопечный обучился совершать какое-либо действие в ответ на условный сигнал, но обычно имеется некоторый интервал времени между предъявлением стимула и ответом субъекта. Вы пригласили людей на ужин, и они немного запоздали, или ваш слон после сигнала к остановке постепенно замедляет ход и наконец останавливается.
Если вы хотите, то, используя ограничение времени отставания, можете в процессе тренировки так сократить этот интервал, что поведение будет возникать так быстро, как это только физически возможно.
Вы начинаете с того, что устанавливаете нормативный интервал, с которым обычно наблюдается поведение; затем вы подкрепляете только то поведение, которое совершается в течение этого интервала. Поскольку живые существа характеризуются вариабельностью, некоторые ответы будут выходить за пределы интервала и за них не будет даваться подкрепление. Например, если вы подаете ужин точно в назначенное в приглашении время, а не ждете опоздавших, то они рискуют получить все холодное или застать меньший выбор.
Когда вы подобным образом установите временной интервал и будете давать подкрепление только на его протяжении, то скоро вы обнаружите, что постепенно все ответы начинают наблюдаться в его пределах и ни один не выходит за него. Теперь вы снова можете подтянуть гайки. Достаточно ли пятнадцати минут, чтобы семья собралась? Начните подавать на стол через двенадцать минут после того, как всех позвали, или через десять. Как быстро вы будете закручивать гайки, должно быть точно определено; как и при каждом процессе выработки желательно находиться в тех пределах, в которых наиболее часто наблюдается данное поведение.
Животные и люди имеют очень развитое чувство времени и чрезвычайно четко реагируют на выработку времени отставания, но дрессировщик не должен полагаться на авось.
Пользуясь часами или даже секундомером, если хотите, чтобы выработка отставления работала на вас. Для поведения ближайших окружающих, включая себя, сократите время ответа, скажем, с пяти тактов до двух. И конечно, если вы работаете с людьми, не обсуждайте ваши действия; вы не получите ничего, кроме возражений. Просто делайте и смотрите, что получается.
В 1960 г. в океанариуме "Жизнь моря" одним из наиболее эффектных номеров, всегда привлекавших внимание, была группа из шести небольших дельфинов, выполнявших различные акробатические трюки в воздухе синхронно. Они совершали различные прыжки и повороты в ответ на подводные звуковые сигналы. Первоначально, когда сигналы только вводились, прыжки, вращения и все остальные действия, которые от них требовались, возникали спорадически с интервалами пятнадцать-двадцать секунд. Но использовав секундомер и установив фиксированное отставание, мы смогли снизить время реакции до двух с половиной секунд. Каждое животное знало, что получить рыбу можно только выскочив в воздух и совершив нужный прыжок или вращение в течение двух с половиной секунд после начала сигнала.
В результате дельфины располагались вокруг подводного источника звука навострив уши, и когда включался сигнал, поверхность бассейна просто взрывалась их телами, извергающимися в воздух; это было действительно зрелище. Однажды, сидя среди зрителей, я была поражена, услыхав, как какой-то человек профессорского вида, - по-видимому психолог, безапелляционно объяснял своим спутникам, что единственный способ, который мы могли применить, чтобы добиться такой реакции, является удар электрического тока.
В реальной жизни ограничение времени отставания является попросту тем временем, которое вы считаете нужным ждать, пока просьба или инструкция будут выполнены. Родителей, начальников, и учителей, которые проявляют последовательность в выработке определенного временного интервала реакции, обычно считают хорошими, заслуживающими того, чтобы с ними иметь дело, даже если отставание - временное "окно", в течение которого должно осуществляться поведение, которое будет подкреплено, - очень короткое.
Предвосхищение.
Наиболее частым недостатком в управляемом сигналами поведении является предвосхищение: как только сигнал усвоен, субъект так стремится продемонстрировать требуемое поведение, что совершает его раньше, чем подается сигнал.
Термин, описывающий это проявление, заимствован из опережающего поведения у людей при состязаниях в беге - опережая выстрел, фальстарт, ложная тревога. Люди, которые опережают указания и просьбы других, обычно считаются нетерпеливыми, выскочками или подобострастными; это очень раздражающая привычка, а вовсе не добродетель.
На соревнованиях по выучке с доберман-пинчерами часто бывают неприятности. Хотя эти собаки прекрасно поддаются дрессировке, они столь возбудимы, что предвосхищают команды по малейшим намекам и начинают работать прежде, чем им в действительности приказывают, теряя при этом баллы. Предвосхищение является обычной ошибкой лошадей, с которых бросают лассо на родео. Предполагается, что ковбой и лошадь должны ждать за барьером, пока не пустят бычка, но возбужденная лошадь перескакивает барьер раньше сигнала.
Ковбой иногда думает, что у него лошадь с высокими ходовыми качествами, но на самом деле это просто недостаточно выработанное управление с помощью сигналов.
Другой чрезвычайно распространенный случай предвосхищения - офсайт в американском футболе. Один из игроков так нетерпелив, что продвигается на территорию другой команды до того, как подан сигнал игры, за что команду наказывают.
С практической точки зрения ликвидировать предвосхищение можно, вводя тайм-ауты. Если субъект предвосхищает сигнал, и если это нежелательно, прекратите, всякую работу. Не давайте сигналов и ничего не делайте целую минутy. Каждый раз как субъект опередит выстрел, останавливайте часы. За нетерпение вы наказываете отставлением возможности работать. Это вызывает очень эффективное подавление опережения команды, в то время как выговоры, наказание или повторение могут оказаться вовсе недейственными.
Стимулы в качестве подкрепления: поведенческие цепи.
Как только стимул становится условным сигналом, происходит интересная вещь: он превращается в подкрепление. Вспомните звонок на перемену в школе. Звонок на перемену является сигналом, условным сигналом, означающим: "Вы свободны, идите и играйте". А кроме того, он воспринимается как подкрепление - дети рады, когда слышат его, и если бы они смогли сделать что-либо, чтоб заставить его прозвенеть скорее, они бы это сделали. Теперь представьте себе звонок на перемену, который не звонит, если в классе нет тишины. Ко времени перемены у вас будет очень тихий класс.
Условный стимул - предвестник подкрепления, и поэтому он становится желаемым событием. Желаемое событие - это само по себе уже подкрепление, а потому вы с успехом можете подкреплять поведение, давая условный стимул другого поведения. Например, я вознаграждаю кошку лакомством, когда она подходит ко мне по команде - она этому научается и выполняет это. Теперь, если я буду говорить: "Ко мне" и вознаграждать ее за реакцию всякий раз как увижу ее - на камине, то скоро окажется, что кошка, стремясь получить лакомство, будет забираться на камин. Как вы помните, с точки зрения кошки, она обучает меня давать ей лакомство. Для этого она нашла способ заставлять меня произносить: "Ко мне". Теперь допустим, что я обучаю ее вспрыгивать на камин, когда я жестом показываю на него, подкрепляя правильные ответы либо пищей, либо командой "Ко мне". Затем я буду жестом указывать на камин всякий раз, когда: а) я знаю, что кошка голодна и б) когда она случайно перевернется через спину...
Я выработала цепное поведение.
Поведенческие цепи - очень распространенное явление.
В реальной жизни мы часто производим серии связанных действий, состоящих из многих отдельных поведенческих актов. Не надо далеко ходить за примерами - работа плотника или уборка квартиры - неплохая иллюстрация. Мы ожидаем, что и наши питомцы будут вести себя так же: "Подойди", "Сядь", "Ляг", "Следуй за мной" и так далее без перерыва и без видимого подкрепления. Эти длительные рады действий являются цепным поведением. В противоположность другим длительным действиям эти могут выполняться часами, сотни раз без напряжения, без сбоев, без задержек, поскольку каждый акт в действительности подкрепляется возможностью выполнить следующее, действие цепочки, и так до заключительного подкрепления выполнением всего дела, всей цепи.
Однако поведенческие цепи рвутся и поведение рассыпается на элементы, если в цепочку вклинивается невыученный поведенческий акт, или действие, не находящееся под контролем стимулов. Вы не можете подкрепить субъекта сигналом, если он этот сигнал не распознает или не может выполнить то, что этот сигнал требует. Отсюда следует, что цепное поведение следует всегда вырабатывать с конца. Начинайте с последнего действия в цепи, удостоверьтесь, что оно усвоено и сигнал к его выполнению хорошо узнается, лишь потом переходите к разучиванию предпоследнего действия и т.д. Например, если при заучивании стихотворения, мелодии, текста речи, роли в пьесе вы разделите задания, скажем, на пять частей и начнете запоминать их в обратном порядке, с конца - вы всегда будете двигаться от того, что вы знаете слабее, к тому, что знаете более прочно, от материала, в котором вы не совсем уверены, к материалу, хорошо уже усвоенному, имеющему подкрепляющее действие. Запоминание материала в том порядке как он написан и должен воспроизводиться приводит к необходимости постоянно продираться от знакомой тропы в сторону более трудного и неизвестного, что - является неподкреплением. Подход к запоминанию материала как к цепному поведению не только убыстряет процесс запоминания, но и делает его более приятным.
Поведенческие цепи - это особое понятие. Я часто сама спотыкалась на них, чувствуя, что надо вернуться к концу ряда, так как я не могу заставить животное, ребенка или себя выполнить кажущуюся простой последовательность действий, пока я не понимала, что пыталась выработать цепное поведение не с того конца. Когда делают пирог, - то глазурью его украшают в последнюю очередь, но если вы хотите обучить ребенка получать удовольствие от приготовления пирога, начните с того, что попросите "помочь" украсить его глазурью.
Пример цепного поведения: обучение собаки игре в фризби (пчелку)
Один мой нью-йоркский знакомый каждый выходной ходил со своим золотистым спаниелем в Центральный парк, чтобы играть в "пчелку". Он рассказывает мне, что сплошь и рядом встречает людей, безуспешно пытающихся обучить своих собак этой игре. Это досадно, потому что игра в "пчелку" прекрасный способ тренировки собаки в городе. По сравнению с простым мячом "пчелка" летит медленнее и по неопределенной траектории, возможно, больше напоминает реальную дичь, заставляет собаку совершать прыжки в попытках поймать ее, что доставляет удовольствие и хозяину. И, наконец, игра в "пчелку" позволяет хозяину, оставаясь на одном месте, заставлять собаку бегать.
Люди жалуются, что, когда они бросают "пчелку", собака наблюдает за ее полетом, продолжая оставаться на месте, хотя если ее раззадорить, то она будет прыгать, пытаясь схватить "пчелку", когда та пролетает мимо. В этой игре два дрессировочных момента: первый состоит в том, чтобы обучить собаку, на какое расстояние она должна отбегать за "пчелкой". Второй состоит в том, что данная игра - цепное поведение: сначала собака гонится за "пчелкой", затем ловит "пчелку", наконец, несет ее назад хозяину, чтобы он снова кинул ее. Поэтому каждому элементу этого сложного поведения следует обучать отдельно, и последнее действие в цепи, принос, должно быть выработано первым.
Вы можете обучить приносу с очень маленьких расстояний даже в доме, используя предмет, который легко носить, скажем, старый носок. Большинство охотничьих собак приносят предметы сами, без обучения, собак некоторых пород, таких, как бульдоги, боксеры, необходимо обучать класть апорт около хозяина или отдавать его в руки, поскольку они предпочитают игры, в которых бы вещи у них отбирали.
Когда по команде собака будет приносить предметы, обучите ее ловить "пчелку". Сначала заставьте собаку как можно сильнее заинтересоваться "пчелкой", двигая ее у самой морды. Позвольте ей несколько раз взять игрушку в рот и добейтесь, чтобы она отдала вам ее обратно, при этом, конечно, бурно поощряйте ее за возврат. Затем подбросьте игрушку в воздух, позвольте собаке завладеть ею в прыжке и заставьте отдать обратно. Затем вы тут же снова подбрасываете игрушку в воздух и бурно радуетесь, когда собака ее поймает. И теперь вы на прямой дороге к получению великолепного игрока в "пчелку".
Расстояние бросков постепенно увеличивается, и собаке необходимо научиться следить за "пчелкой" и перемещаться так, чтобы поймать ее. Это требует тренировки, поэтому может понадобиться пара выходных, чтобы заставить собаку отходить на семь-восемь метров. Некоторым очень быстрым собакам удается оказываться точно на месте и ловить "пчелку" на таком большом расстоянии, на какое вы сможете ее забросить. Мне приходилось встречать необыкновенных собак, которые могли поймать "пчелку" на другом конце футбольного поля. Создавалось впечатление, что собаки получают удовольствие от точности своей оценки места падения.
Блестящий бег или фантастические захваты в прыжках с переворотом, которые вызывают восторг зрителей, - тоже доставляют собаке радость. Тем не менее, поймав "пчелку", собака несет ее вам, поскольку последнее звено цепи разучено первым и поскольку именно это действие приводит к подкреплению, будь то ваша похвала или другой бросок. Разумеется, если вы будете невнимательны и собака будет систематически не получать похвалы или следующего броска не будет, принос подвергнется затуханию. И еще, когда собака слишком устает и не хочет больше играть, она начинает все хуже и хуже приносить "пчелку", медлит с возвращением и бросает ее на полпути. Это означает, что пора остановиться - вы оба уже взяли от игры все.
Генерализованное управление с помощью Стимулов.
С большинством животных приходится сначала немного повозиться, чтобы установить управление их поведением с помощью стимулов, но часто к тому времени, как берете под контроль сигналов третий или четвертый тип поведения, оказывается, что животное как бы обобщает, у него появляется нечто вроде понимания идеи. Выучив три-четыре условных поведенческих акта, большинство субъектов, по-видимому, начинают распознавать определенные события в качестве сигналов, каждый из которых означает свой тип поведения, и что получение подкрепления зависит от правильного распознавания и ответа на сигналы. С этого момента введение условных сигналов становится простым. У субъекта уже имеется общая картина, и все что ему надлежит сделать - это научиться классифицировать новые сигналы и ассоциировать их с правильным поведением. Если вы, как дрессировщик, поможете питомцу, сделав это понятным, последующее обучение может идти само собой много быстрее, чем трудные начальные шаги.
У людей обобщение происходит еще быстрее. Если вы вознаградили за ответ только на одну выученную команду, люди очень скоро начинают давать ответы и на другие команды, чтобы заслужить подкрепление. Мой друг Ли, учитель математики шестого класса школы в одном из непривилегированных районов Нью-Йорка, каждый учебный год начинает с того, что обучает школьников выбрасывать жевательную резинку, как только он попросит их об этом. Никакого принуждения. Просто: "Все, внимание, жевательную резинку изо рта. Хорошо! Стоп! Подождем, у Дорин она еще есть... великолепно! Она ее вынула. Молодец, Дорин!". Он говорит детям, что после урока они могут снова взять жевательную резинку (используя в качестве подкрепления слова "Класс свободен!"). Это может показаться фривольным и даже глупым (поскольку это стоит Ли вида жующих челюстей, чего он терпеть не может), но Ли установил, что этот первый опыт подготавливает его класс к тому, что выполнение его просьб создает возможность подкрепления. Конечно, подобно хорошему дрессировщику китов, он использует разнообразные подкрепления, помимо хороших отметок и собственной похвалы, включая игры, одобрение сверстников, более ранее окончание урока, даже раздачу жевательной резинки. И конечно, сначала он уделяет много времени жевательной резинке, вместо того, чтобы уделять его десятичным дробям, дети думают, что он помешан на резинке. Но дети так же придают значение его словам и считают, что имеет смысл делать то, что хочет Ли.
Другие учителя думают, что у Ли врожденное умение поддерживать тишину в классе, а директор считает его хорошим "дисциплинщиком". Что же касается Ли, то он считает детей достаточно сообразительными, чтобы обобщить свои реакции, и любит их за это. А жевательная резинка тут ни при чем.
Провалы преднаучения и вспышки раздражения.
Установление контроля над поведением с помощью стимулов часто порождает интересный феномен, который один из тренеров назвал "провалом преднаучения". Вы сформировали поведение и теперь пытаетесь сделать его управляемым с помощью стимулов. Но когда вам кажется, что субъект уже проявляет способность отвечать на стимулы, он внезапно перестает отвечать не только на стимулы, но и вообще давать нужные реакции. Он ведет себя так, будто никогда и не слышал о действиях, которые вы сформировали.
Этот момент полностью обескураживает тренера. Вот вы очень изобретательно научили цыпленка танцевать, а теперь хотите, чтобы он танцевал только, когда вы поднимаете правую руку. Цыпленок смотрит на вашу руку, но не танцует.
Или же он может стоять на месте, когда вы подаете сигналы, и начинать интенсивно отплясывать, когда никакого сигнала не было.
Если вы построите график этой последовательности, то увидите постоянно идущую кверху линию, отражающую увеличение процента правильных ответов (т.е. ответов на сигналы), которая затем резко снижается, ибо соответственно правильность ответов падет до нуля (когда вы имеете букет отсутствия ответов и неправильных ответов). Однако если вы продолжаете упорно работать, затем внезапно наступает озарение: вдруг, совершенно случайно, субъект скачком начинает отвечать на команды действительно идеально - вы поднимаете руку, цыпленок танцует. Поведение управляется стимулами.
На мой взгляд, происходит вот что: сначала субъект выучивает сигнал, не осознавая этого, дрессировщик видит только обнадеживающую тенденцию медленного нарастания правильного выполнения команд. Но затем субъект замечает (!) сигнал и осознает, что на него надо как-то отвечать, чтобы получить подкрепление. В этот период он уделяет большее внимание сигналу, чем проявляемому поведению. Конечно, при этом ответ отсутствует, так же как и подкрепление. Когда же, по случайному стечению обстоятельств, или в результате упорства тренера, субъект однажды осуществит реакцию при наличии сигнала и получит подкрепление, у него "возникнет картина". С этого момента он "знает", что означает сигнал, и отвечает на него правильно и уверенно.
Я понимаю, что говорю по этому поводу много таких слов, как "отдает себе отчет", "знает" в отношении того, что происходит в голове субъекта, которые большинство психологов считают неприменимыми к животным. Однако при дрессировке животных иногда так оно и есть, что уровень правильных ответов постепенно нарастает, хотя внешне ничего существенного не происходит; трудно сказать, с какого момента, если таковой вообще существует, животное начинает осмысленно отдавать себе отчет в том, что делает. Но наличие провала преднаучения, по моему мнению, является отражением осознания, вне зависимости от того, какие процессы в это вовлекаются. Я могла обнаружить ярко выраженное проявление провала преднаучения (а следовательно, и своего рода сдвиг осознания) в данных Мишеля Уолкера, исследователя из Гавайского университета, ставившего эксперименты по сенсорному различению у тунца, одного из наиболее разумного вида рыб, но в конце концов только рыбы.
Для субъекта провал преднаучения - время наибольших огорчений. Мы все знаем, как расстраивает борьба с тем, что понимаем только наполовину (общеизвестный пример - математические понятия), зная только то, что по-настоящему их не понимаем. Часто субъект бывает настолько расстроен, что проявляет гнев и агрессивность. Дети разражаются слезами и тычут в учебник математики карандашом. Дельфины многократно выпрыгивают из воды и шлепаются о ее поверхность со страшным шумом. Лошади размахивают хвостом и норовят лягнуть. Собаки рычат. Доктор Уолкер обнаружил, что если при выработке распознавания стимула он допускает, что его подопытные тунцы и совершают ошибки и не получают подкрепления более сорока пяти секунд, они настолько расстраиваются, что выпрыгивают из бассейна.
Я пришла к тому, что стала называть эти проявления преднаучения вспышками раздражения. Мне кажется, что вспышки раздражения возникают потому, что субъект, считавший себя всегда правым, вдруг обнаруживает, что он ошибается (раз за разом), а причина этого неясна... пока. У людей вспышки раздражения в период преднаучения, по-видимому, часто происходят в моменты, когда бросается вызов привычным представлениям, которых длительно придерживались, а где-то в глубине души субъект знает (!), что в новой информации кроется некая правда. Именно распознание того, что выученное ранее не совсем верно, по-видимому, и приводит к неистовым возражениям, чрезмерным ответам, которые намного превышают степень несогласия, спорам, скандалам, которые могут казаться по наитию наиболее подходящими и вероятными к случаю. Иногда, рассказывая о подкреплении в научных кругах, я вызывала, большую, чем предполагала, враждебность со стороны представителей других дисциплин, начиная от психологов, занимающихся познавательными процессами, кончая нейрологами и представителем высшего духовенства. Я часто подозреваю, что гневные слова являются симптомом преднаучения.
Я всегда сожалею, когда вижу приступы плохого настроения, связанного с преднаучением, даже у тунцов, потому что при определенных навыках можно провести субъекта по пути обучения, не вызывая столь большого раздражения. Однако я пришла к убеждению, что вспышки раздражения в период преднаучения являются четким индикатором того, что вот-вот произойдет истинное обучение. Если вы отойдете в сторонку и дадите ему отшуметь как ливню, то вслед за этим может появиться радуга.
Применение управления с помощью сигналов.
Никому не нужно постоянно управлять или быть управляемым с помощью условных стимулов или выученных сигналов, живые существа - это не машины. В действительности реакция на выученный сигнал представляет собой усилие, причем такое усилие, которое не только не должно, но и не может поддерживаться постоянно.
Большую часть времени у начальника нет надобности держать подчиненных радом. Если дети бездельничают, а вы не очень спешите, то вы можете сами расслабиться. Служащим, которые и так уже работают с полной отдачей, не нужны приказы и инструкции. Ни нас самих, ни других людей не должны опутывать ненужные правила и регламентации: они вызывают только сопротивление.
Совершенно очевидно, что управление с помощью стимулов используется, чтобы дети стали воспитанными, домашние животные слушались, персонал был надежным и т.д.
Очень своеобразное управление с помощью стимулов необходимо также для многих видов коллективной деятельности, таких, как марширующие колонны, танцевальные ансамбли, спортивные команды. Отвечать на выработанную систему выученных сигналов доставляет определенное удовольствие, даже животным, по-видимому, это нравится. Я думаю, это происходит оттого, что стимулы становятся подкреплениями, как в поведенческой цепи, так что, когда овладеваешь всеми типами поведения и сигналами, осуществление ответов имеет сильное подкрепляющее действие. Словом, это интересно.
Отсюда то удовольствие от участия в управляемой стимулами групповой деятельности, как, например, согласованный танец, игра в футбол, хоровое пение и игра в оркестре.
Когда мы видим какой-либо пример прекрасно управляемого сигналом поведения, начиная с фигур высшего пилотажа, исполняемых группой истребителей, до класса хорошо умеющих вести себя детей, то, желая похвалить их, используем понятие дисциплины. "Они поистине хорошо дисциплинированы" или "Этот учитель знает, как поддерживать дисциплину". Однако понятие о дисциплине включает применение наказания, которое, как мы видели, совершенно не нужно при установлении управления с помощью стимулов.
В обиходе сторонниками дисциплины считаются инструктор, родитель, тренер, которые требуют совершенного исполнения и наказывают за любое отклонение, а совсем не те, кто добивается совершенства, подкрепляя улучшения в его сторону. И именно поэтому люди, задавшиеся целью установить "дисциплину", часто пытаются управлять с помощью стимулов на основе: "Делай, что я скажу, иначе..." Поскольку субъект должен ошибиться или не послушаться, чтобы узнать, что значит "иначе", и поскольку тогда становится уже слишком поздно этого не совершать, то этот распространенный подход вовсе не так хорош.
Истинное, изящное управление сигналами, установленное с помощью подкрепления, может делать то, что мы считаем дисциплиной субъекта. Однако кто должен стать действительно дисциплинированным так это тренер.
Да, но с чего начать? Что, если вы живете и работаете среди людей, которые являются закоренелыми неслухами?
Вот система Карен Прайор эффективного воздействия в тяжелом случае.
Карен Прайор (видя мокрые плавки и полотенце Юного Гостя на кушетке в гостиной): Пожалуйста, снимите свои мокрые вещи с кушетки и повесьте на сушилку.
Юный Гость: О'кей, минуточку.
К.П. (подходит к Ю.Г. и стоит рядом с ним молча).
Ю.Г. В чем дело?
К.П. Пожалуйста, снимите свой мокрый купальник с кушетки и повесьте на сушилку (NB: не прибавляя: "Сейчас же!", "Сию минуту!", "Я сказала" или что-нибудь в этом роде. Я обучаю этого человека выполнять просьбы с первого раза, а не ждать, когда сигнал будет усилен дальнейшими деталями ими угрозами.)
Ю.Г. Вот еще, если вы так спешите, то почему бы вам не сделать это самим?
К.П. (Любезная улыбка, но никакого ответа. Я жду момента подкрепить желаемое поведение. Препирательство со мной не является желаемым поведением, поэтому я пренебрегаю им.)
Ю.Г. Ладно, ладно (Встает, идет к кушетке, забирает вещи, бросает их в комнату, где стирают.)
К.П. В сушилку.
Ю.Г. (Ворчит, поднимает и вешает вещи на сушку.)
К.П. (Широкая улыбка, искренне, без издевки) Благодарю вас!
В следующий раз, когда мне будет нужно попросить юного гостя что-нибудь сделать, возможно, мне потребуется всего лишь взглянуть на него, чтобы вызвать действие. Мало-помалу он станет одним из тех домочадцев, которые быстро исполняют мои просьбы, а я со своей стороны - буду платить ему тем же, буду выполнять то, что он просит, если это выполнимо, и буду стараться не просить его делать более, чем он должен.
Знание того, как добиться управления с помощью стимулов, не прибегая к крику и принуждению, в равной мере облегчает жизнь всем - воспитателю и обучаемому. Когда моя дочь Гейл поступила в высшую школу, ей пришлось ставить учебную пьесу, ежегодно для этого выбирали кого-либо из студентов.
|
|