Skip to content

Category Archives: Formal

My attempts at sorta formal thinking

Правописание

angry emoticon

Значительная часть рунета:

  • Не знает, что до и после дефиса положено ставить пробелы.
  • Вообще не ставит пробелов туда куда надо и ставит туда куда не надо.
  • Не владеет окончаниями на “тся”-”ться” и пишет “цца”.

И вообще препятствует токенизации как только может.

P.S. А, да. Еще они злоупотребляют троеточиями направо и налево, но это вообще характерно для определенной группы лиц, общие характеристики которой я пока не пытался выделить — окромя того, что у них невероятная каша в голове. От языка это, как ни странно, не зависит.

Фильтры

angry emoticon

Основная проблема социологии которая постоянно мешает мне жить — это проблема фильтров. Если точнее, это проблема выделения для исследования лиц, обладающих некими данными характеристиками, но не имеющих реально связывающих их в легко выделяемую группу структур. Я даже не могу никого опросить, потому что не имею способа сконцентрироваться на исследуемом подмножестве не вызывая при этом сомнений в репрезентативности.

Можно сколько угодно рассуждать о ролевиках, но нельзя выделить их из общей массы населения таким образом, чтобы быть уверенным в репрезентативности выборки. То же самое касается людей реагирующих на спам, и много кого еще.

Похоже надо сочинять какие-то совершенно невероятные по объемам пожираемых данных методы контент-анализа, а мне не хватает лингвистики…

Абсолютно черное тело

thoughtful emoticon

Я люблю проблемы Ферми вообще. Впрочем, об этом я говорил и раньше — я люблю получать информацию вообще из ничего. Эта информация не точна. Эта информация имеет не так много общего с реальностью. И в то же время, этой информации обычно достаточно для того, чтобы сформулировать стратегию по получению дальнейших данных, или по крайней мере представить себе масштаб проблемы. Это просто задача на прикидку масштаба, не более и не менее. Знать масштаб нередко достаточно для принятия решения.

Классическим случаем проблемы Ферми является уравнение Дрейка. Это оценка числа внеземных цивилизаций, с которыми мы теоретически можем пытаться установить контакт.

Continue reading ›

И еще раз о магическом взгляде на реальность

thoughtful emoticon

Все, что я собрался сейчас сказать — редкостный баян, но надо записать для памяти в жесткой формулировке.

после ознакомления с курсом “теорфизики для математиков”, я и мои друзья пришли к мысли, что физика это магия, и понять ее как следует совершенно невозможно, как и магию.

(цит. по комментариям к “Образование как отбор“)

Уже любопытно, правда?

Continue reading ›

Житейская и математическая логика

amused emoticon

Набрел я на одну смешную задачку. Звать The Pirate Game. Суть состоит в следующем:

Пятеро пиратов, A, B, C, D и E, из которых A старше и влиятельнее B, который, в свою очередь, старше и влиятельнее C, и так далее до самого низа, так вот, они намерены поделить 100 золотых монет. При этом, они должны следовать следующему протоколу, установленному пиратской традицией:

  1. Старший пират предлагает распределение золотых.
  2. Вся компания голосует по этому предложению, и если большинство голосов “за”, предложение принимается и деньги делятся.
  3. В случае если большинство голосов “против”, предложившего распределение выбрасывают за борт на корм акулам и возвращаются к пункту 1.
  4. В случае ничьей, старший пират обладает правом председательского голоса для разрешения ничьей.

Постулируется, что пираты логичны, рациональны, и могут просчитать ситуацию до предела. Также постулируется что все они хотят жить, все они любят деньги и хотят получить как можно большее их количество. Еще они любят бросать других пиратов за борт.

Теория игр, принимая все вышеописанные данные дает парадоксальный результат распределения которое будет принято — A:98, B:0, C:1, D:0, E:1. Получается оно благодаря тому, что если первые три предложения не приняты, и A, B и C благополучно съедены акулами, D, как старший, может предложить распределение D:100 E:0, и оно будет принято согласно пиратским традициям. Зная это, прочие пираты будут пытаться подкупить млашдих пиратов минимальной возможной суммой золотых, и те, зная что больше им не светит, это предложение примут.

Но что произойдет в реальном мире с настоящими пиратами? А в реальном мире распределение которое будет принято скорее всего будет A:20, B:20, C:20, D:20, E:20, или — B:25, C:25, D:25, E:25, или C:33, D:33, E:33, или D:50, E:50… Все зависит только и исключительно от того, насколько именно пираты боятся старших, и насколько они склонны договариваться друг с другом, чтобы голосовать совместно — не потому, что их не устраивает предложенное распределение, а потому, что они хотят отправить председателя за борт. Если председатель в курсе, что возможность сговора существует, он предложит первый вариант и дополнит его соответствующей речью о братстве всех людей большой дороги, то есть тьфу, моря. Реально количество пиратов отправленных за борт будет зависеть от точки равновесия между их жадностью, жестокостью и страхом.

Чем-то все это удивительно напоминает Digg и прочие подобные системы — в реальном мире неминуемо возникают аналоги политических партий и прочих подобных объединений, которые теория рационального актора в чистом виде не рассматривает…

Так называемое “быдло”…

thoughtful emoticon

Я хотел бы ввести это как научный термин, за неимением лучшего, более понятного слова, потому что “пролетариат”, “люмпены” и прочие слова которые мы обычно считаем синонимичными слову “быдло”, имеют уже свои совершенно конкретные значения, которые, однако, синонимичными тому, что мы обычно интуитивно понимаем под словом “быдло” никак не являются. Оскорбительность его пока оставим за кадром, если кто-то предложит мне альтернативу — милости прошу.

Так вот, на это размышление меня подвиг взгляд на форум SEOшников. Т.е. тех людей, которые ответственны за то, что ссылку на порносайт можно найти, осуществляя поиск по строке “MySQL manual”. Поисковики воюют с ними много лет, с переменным успехом с обеих сторон, но принципиально не это… Выстрою-ка я логическую цепочку.

  1. Чтобы любой спам окупался, нужно чтобы хоть кто-то обращал на него внимание — кликал на ссылки и смотрел баннеры, покупал предлагаемые товары и услуги, и так далее.
  2. Поскольку стоимость спама как рекламы чрезвычайно низка, т.е. перекладывается на наши с вами плечи, CPT1 ниже плинтуса, и соответственно, одна реакция из сотни тысяч полностью окупает всю операцию.
  3. Но кто он — тот человек, который покупает лекарства (!) таким манером, инструкции по способам увеличения половых органов, и всю эту прочую дрянь?
  4. Очевидно что я, рассматривая мир в основном через призму интернета, его просто не вижу, потому что он не генерит никакого контента, точно так же как нельзя увидеть в телескоп черную дыру, ибо она не светится. Сомневаюсь, что кто-то из вас знает таких лично в достаточном количестве, ибо эти люди блогов тоже не читают.
  5. Но тем не менее они существуют, и существует их достаточное количество, чтобы сделать спам-операции прибыльными.
  6. Количество их при этом не обязательно велико. Помнится мне, для спама — и для более ранней идеи, почтовой рекламы — хорошим показателем считается отзыв на доли процента показов. Для баннерной рекламы, кстати, тоже.
  7. Если бы спамеры знали кто эти люди, могли бы бить по ним адресно, они бы так и делали, и экономили бы время, деньги и заодно нервы всем остальным.
  8. А если бы мы знали, кто эти люди, возможно мы знали бы, как им помочь.

Их называют словом “быдло”, с намерением оскорбить и унизить, но каковы реальные характеристики быдла? Они отнюдь не такие же, как у среднего потребителя телевизионной или печатной рекламы, характеристики которых в общем известны, потребители нормальной рекламы не ловятся так легко на такие глупости, как то, что можно наблюдать в спаме. Что это за люди?

  1. Сколько их на самом деле? Если бы быдло составляло подавляющее большинство, как принято считать, то число отзывов на спам превышало бы доли процента.
  2. Что определяет принадлежность человека к быдлу? Уровень образования? Сомнительно, ведь известны прецеденты, когда люди с достаточно высоким уровнем образования и учеными степенями ловились на классические advance fee fraud. Возраст? Тоже сомнительно, по той же причине. Что общего у всех этих людей?
  3. Наконец, сколько им лет, сколько у них денег, каких политических взглядов они придерживаются, каковы их социокультурные характеристики?

У меня пока есть только одна теория, а именно, что это некий странный подвид патологической наивности, свойственной лишь небольшой доле населения. Я не знаю, наследственное оно или нет, хотя не исключено и это. Это наивность того же порядка, как и та что побуждает людей складывать пятидюймовую дискету вчетверо чтобы засунуть ее в трехдюймовый дисковод, а Хоттабыча побудила наколдовать телефон-автомат, высеченный из цельного куска мрамора. Возможно, это как-то связано с одним из очень странных эффектов восприятия, когда некоторые люди не в состоянии увидеть, что изображение 16:9 растянуто по вертикали чтобы уместить его в экран 4:3, или рисуют так, что все объекты оказываются скошены вправо — я встречал таких и спрашивал, они действительно не видят разницы.

Узнать, свойственна ли такая наивность человеку всегда, или является временной, и что она такое на самом деле, было бы чрезвычайно интересно.

  1. Cost Per Thousand, стоимость тысячи просмотров рекламы — есть в медиапланировании такой параметр.

Статистическая невозможность и социальная вероятность

enthusiastic emoticon

Я говорил раньше, правда не писал, о понятии статистической невозможности — когда нечто невозможно потому, что слишком невероятно, а не потому что не бывает вообще. Теперь я впервые вижу цепочку рассуждений которой я когда-то пользовался, пересчитанную в цифрах математиком:

It is here, at a pool of 18 726 acceptable females, that we end our statistical analysis. At first glance, a datable population of 18 726 may not seem like such a low number, but consider this: assuming I were to go on a blind date with a new girl about my age every week, I would have to date for 3493 weeks before I found one of the 18 726. That’s very nearly 67 years. As a North American male born in the late 1970s, my life expectancy is probably little more than 70 years, so we can safely say that I will be quite dead before I find the proverbial girl of my dreams.

(цит. по “Why I Will Never Have a Girlfriend“)

Он, кстати, учел разницу между развитыми и не развитыми странами, чего я не делал. И тем не менее, он не учитывает, что:

  1. Трещины при фрагментации социальной реальности уменьшают общий массив значительно.
  2. Они же приводят к тому, что доля интересующей группы лиц во фрагменте в котором нахожусь я выше, чем во всей остальной популяции.
  3. Социальные встречи не подчиняются законам классической вероятности, т.е. не существует способа выбирать лиц из общего массива действительно случайным образом.

В результате, событие хоть и невероятно, но все-таки изредка происходит. :)