Em formação

Como os humanos são capazes de ler texto / caracteres embaralhados (por exemplo, CAPTCHA)?

Como os humanos são capazes de ler texto / caracteres embaralhados (por exemplo, CAPTCHA)?

Então, estou fazendo uma pesquisa sobre o desenvolvimento de um novo sistema CAPTCHA baseado em texto. Eu desenvolvi um esquema onde os caracteres em um texto são quebrados / divididos individualmente e aleatoriamente, tornando difícil para as máquinas de OCR decodificá-lo. (Veja a figura, por exemplo) Este CAPTCHA ainda está em desenvolvimento, mas dá uma ideia aproximada do que estou falando aqui.

Meu principal objetivo aqui é entender como o cérebro lê caracteres embaralhados, conforme mostrado na figura. Eu estava olhando para cima e surgiu um termo chamado fenômeno de visão "preenchimento". Não tenho certeza se esse termo está certo neste contexto.

Eu quero saber a terminologia e o entendimento básico de como os humanos são capazes de ler texto / caracteres embaralhados facilmente.


Um cérebro humano reconhece letras por suas características constituintes (partes de sub-letras). É modelado por um modelo pandemônio onde a informação impressa é extraída localmente e depois globalmente. Na literatura de reconhecimento de letras, esse tipo de modelo hierárquico baseado em recursos compete com as teorias de correspondência de modelos (com uma vantagem para os modelos do tipo pandemônio, como redes de aprendizagem profunda).

Personagens embaralhados são reconhecidos da mesma forma, com a diferença de que apenas parte da informação visual está disponível. Relaciona-se com a teoria dos geons desenvolvida por Biedermann (Reconhecimento por componentes, 1987). Ele escreveu

se um arranjo de dois ou três subcomponentes pode ser recuperado da entrada, os objetos podem ser rapidamente reconhecidos mesmo quando estão obstruídos ou amplamente degradados.

Você poderia identificar o seguinte objeto? A esquerda é a versão irrecuperável.

REF:

  • Grainger et al (2008). Percepção de letras: dos pixels ao pandemônio. Trends in Cognitive Science.
  • Biederman, Psychological Review (1987) e http://en.wikipedia.org/wiki/Recognition-by-components_theory

O número cumulativo de versões de um único personagem que o cérebro humano pode reconhecer é quase infinito, enquanto os computadores precisam ser programados para reconhecer cada variação. Os humanos também reconhecem o "contexto" em uma palavra, enquanto um computador não reconhece o contexto porque não possui uma compreensão intuitiva da linguagem. Da wikipedia:

Por exemplo, quando um indivíduo entende que a primeira letra de um CAPTCHA é um “a”, esse indivíduo também entende onde estão os contornos desse “a” e também onde ele se funde com os contornos da próxima letra. Além disso, o cérebro humano é capaz de pensar dinâmico com base no contexto. É capaz de manter várias explicações vivas e, em seguida, escolher aquela que é a melhor explicação para toda a entrada com base em pistas contextuais. Isso também significa que ele não será enganado por variações nas letras.

Essencialmente, isso se resume a dois fatores: um, os humanos são pré-programados com habilidades de 'reconhecimento de objetos'. Dois, os humanos são capazes de analisar uma sequência de símbolos de uma maneira que esteja de acordo com as regras de uma gramática formal.

O reconhecimento de objetos é a capacidade de encontrar, reconhecer e identificar objetos humanos em uma sequência. Os humanos têm naturalmente essa habilidade, enquanto os computadores não. Parece ser uma qualidade genética e pode ser replicada em computadores por algoritmos genéticos que imitam o processo de seleção natural.

Os humanos também constroem frases aos poucos e, à medida que o fazem, fazem constantes previsões inconscientes sobre o que a palavra ou frase vai dizer. Esta é a explicação por trás das frases do caminho do jardim. Podemos usar potenciais relacionados a eventos para estudar esse fenômeno no cérebro humano. Certos potenciais são ativados durante situações específicas durante a análise. Na página da Wikipedia sobre frases de caminho de jardim:

Dentro dos ERPs, o P600 é o componente mais importante. Sua ativação ocorre quando o analisador se depara com uma violação sintática, como O corretor persuadido a vender as ações ou quando o analisador sintetiza uma desambiguação insatisfatória em uma sequência ambígua de palavras como O médico acusado de que o paciente estava mentindo. Portanto, a ativação de P600 marca a tentativa do analisador de revisar a incompatibilidade ou ambigüidade estrutural da frase.

Também parece que a presença de uma disfluência em uma frase - causada por análises silenciosas preenchidas e longas - não elicia o P600. Em vez disso, ele elicia outro componente do ERP, o N400, que é ativado quando as pessoas tentam integrar uma nova palavra ao contexto da frase anterior.

Com base no que precede, parece que o cérebro tem potenciais relacionados a eventos específicos que se ativam intuitivamente durante situações específicas durante a análise. Em outras palavras, um humano pode reconhecer frases e palavras familiares intuitivamente e, quando se depara com uma palavra não reconhecida, ele tenta integrá-la com base no contexto. Uma vez que os computadores não têm atualmente uma habilidade intuitiva semelhante, os CAPTCHAs são mais difíceis de decodificar.


Como os humanos são capazes de ler texto / caracteres embaralhados (por exemplo, CAPTCHA)? - psicologia

Segundo um pesquisador (sic) da Universidade de Cambridge, não importa a ordem das letras em uma palavra, o importante é que a primeira e a última letra estejam no lugar certo. O resto pode ser uma bagunça total e você ainda pode lê-lo sem problemas. Isso ocorre porque a mente humana não lê todas as letras por si mesma, mas a palavra como um todo.

Este texto circulou na internet em setembro de 2003. Tomei conhecimento dele pela primeira vez quando um jornalista contatou meu colega Sian Miller em 16 de setembro, tentando rastrear a fonte original. Ela foi transmitida muitas vezes e, como a maioria dos memes da Internet, sofreu mutações ao longo do caminho. Pareceu-me interessante - especialmente quando recebi uma versão que mencionava a Universidade de Cambridge! Trabalho na Cognition and Brain Sciences Unit, em Cambridge, no Reino Unido, uma unidade do Medical Research Council que inclui um grande grupo que investiga como o cérebro processa a linguagem. Se há uma nova pesquisa sobre leitura que está sendo conduzida em Cambridge, achei que deveria ter ouvido falar dela antes.

Escrevi esta página para tentar explicar a ciência por trás desse meme. Há elementos de verdade nisso, mas também algumas coisas que os cientistas que estudam a psicologia da linguagem (psicolinguistas) sabem que são incorretas. Vou quebrar o meme, uma linha por vez, para ilustrar esses pontos, apontando o que considero ser a pesquisa relevante sobre o papel da ordem das letras na leitura. Novamente, esta é apenas minha visão do estado atual da pesquisa de leitura, no que se refere a este meme. Se você acha que perdi algo importante, me avise [matt.davis & # 64 mrc-cbu.cam.ac.uk].

Outras línguas:

Meus colegas e eu também conhecemos as versões em espanhol e francês que anexei abaixo. Existem, sem dúvida, versões em muitos outros idiomas também. Se você souber de outros, me informe [matt.davis & # 64 mrc-cbu.cam.ac.uk] e eu os adicionarei à lista. Eu estaria especialmente interessado em versões deste texto em idiomas que (pelo menos que eu saiba) funcionam de maneira muito diferente do inglês em sua forma escrita. Por exemplo:

1) línguas semíticas (como hebraico ou árabe), onde as vogais tendem a não ser escritas no texto

2) línguas aglutanativas (como finlandês ou turco), onde as palavras são dramaticamente mais longas do que em inglês

3) idiomas como o tailandês, que (convencionalmente) não colocam espaços entre as palavras

4) linguagens logográficas, como o chinês, em que símbolos complexos representam uma palavra ou conceito completo.

Atualização (7/10/03):

Parece que pelo menos uma das minhas previsões está correta. Graças a Peter Eskolin e Ari Ruottu, tive algumas sugestões para versões em finlandês do texto. Peter e Ari sugerem que o texto embaralhado resultante é muito difícil de ler. Seus nomes estão vinculados às sugestões de versões embaralhadas do texto.

Uma possibilidade interessante (graças a Rémy Viredaz e outros que mencionaram isso) é que uma coisa que torna esses embaralhamentos difíceis de ler é que as letras embaralhadas frequentemente se movem além dos limites dos morfemas. Uma maneira de tornar as palavras polimorfêmicas mais fáceis de ler quando embaralhadas seria manter as letras em uma posição próxima à sua localização original. Isso é aparente em algumas das versões alemãs do texto.

Também recebi uma versão hebraica do texto, que aparentemente não pôde ser lida quando embaralhada. No entanto, não consegui ler os personagens, desculpe! Se algum de vocês puder ajudar na conversão de texto hebraico em arquivos gráficos, me avise.

Graças a Samuel Wazana e John Sutton, agora tenho uma versão em hebraico do texto original e embaralhado. Samuel sugere que o texto embaralhado é "uma bagunça REAL .. você não consegue entender de jeito nenhum". Isso pode refletir uma propriedade interessante do sistema de escrita hebraico. Como as vogais não são escritas no texto, há muito menos redundância no hebraico escrito. Pode ser que os leitores já estejam usando alguns processos de inferência para descobrir o que são as palavras escrita, a carga extra adicionada por letras embaralhadas cria um nível de dificuldade adicional excessivo. Também é possível que palavras escritas sejam mais confundíveis em hebraico - ou seja, muitas outras palavras são como "sal" e "ripa", em que as transposições de letras criam outras palavras.

Obrigado a todos os vários leitores que se ofereceram para ajudar a colocar um texto em hebraico online.

Sgeun un etsduio de una uivenrsdiad ignlsea, no ipmotra el odren en el que las ltears etsan ersciats, la uicna csoa ipormtnate es que la pmrirea y la utlima ltera esten ecsritas en la psiocion cocrrtea. El rsteo peuden estar ttaolmntee mal y aun pordas lerelo sin pobrleams. Etso es pquore no lemeos cada ltera por si msima preo la paalbra es un tdoo.

Sleon une édtue de l'Uvinertisé de Cmabrigde, l'odrre des ltteers dnas un mtos n'a pas d'ipmrotncae, la suele coshe ipmrotnate é que la pmeirère et la drenèire soit à la bnnoe pclae. Le rsete peut êrte dnas un dsérorde ttoal et vuos puoevz tujoruos lrie snas porlblème. C'est prace que le creaveu hmauin ne lit pas chuaqe ltetre elle-mmêe, mias le mot cmome un tuot.

(note que as letras estão misturadas e que os acentos mudaram com as letras associadas).

Vlgones een oznrdeeok op een Eglnese uvinretsiet mkaat het neit uit in wlkee vloogdre de ltteers em een ​​wrood saatn, het einge wat blegnaijrk is is dat de eretse en de ltaatse ltteer op de jiutse patals saatn. De rset van de ltteers mgoen wllikueirg gpletaast wdoren en je knut vrelvogens gwoeon lzeen wat er saatt. Dit kmot odmat we neit ekle ltteer op zcih lzeen maar het wrood als gheeel.

Obrigado a Sander Jonkers por passar isso adiante, e ao pessoal da Onzetaal por criar um link para este site.

En viskdenbaleig unsdelrøgelse lavet af et untivseriet i Enlgnad har vist, at desrom de to føsrte og de to sisdte botsvgaer i all oredene i en tekst er ritgigt pledsaret, spllier det inge rolle knevirkel ræføkilen rægøkilen ræføkilen ou bosque knevirge. Tektsen er fuldt læbsar selv om de adre bogastver kommer huilbtertlulter! Det er, fordi vi ikke læser hvert eneklt botgsav, men ser bildeler af ordet som en hehled.

Agradeço a Randi Starrfelt por enviar isso para mim.

Você notará que algumas dessas traduções afirmam que a pesquisa vem de uma "English University" (o que está correto), ao invés de "Cambridge University".

Die Bcuhstbaenrehenifloge em eneim Wrot ist eagl

Ncah enier nueen Sutide, die uetnr aerdnem von der Cmabirdge Uinertvisy dührruchgeft wrdoen sien slol, ist es eagl, in wlehcer Rehenifloge Bcuhstbaen em eneim Wrot sethen, Huaptschae, der esrte und ltzetehcien der ltzetehcien. Die rsetclhien Bshcuteban kenönn ttoal druchenianedr sien, und man knan es tortzedm onhe Poreblme lseen, wiel das mneschilhce Gherin nhcit jdeen Bcuhstbaen enizlen leist, snodren das Wrot als gnazes. Mti dme Pähonemn bchesfätgein shci mherere Hhcochsluen, acuh die aerichmkianse Uivnäseritt em Ptstbigurh. Esrtmlas üebr das Tmeha gchseibren hat aebr breteis 1976 - und nun in der rgchitien Bruecihhsetnafoelngbe - Graham Rawlinson in sieenr Dsiestraiton mit dem Tetil "A Significância da Posição da Letra no Reconhecimento de Palavras" an der egnlsmice.

Obrigado a Hermann Schwarting por me enviar isso por e-mail. Isso apareceu no Frankfurter Allgemeine Zeitung em 24.09.03. Você notará que isso é bastante estendido e inclui uma referência correta à tese de Graham Rawlinson.

Há também a seguinte tradução - que é muito mais próxima do original em inglês (de Robert Fuchs):

Luat eienr Stduie der Cambrdige Unievrstiät speilt es kenie Rlloe in welcehr Reiehnfogle die Buhcstbaen in eniem Wrot vorkmomen, die eingzie whctige Sahce ist, dsas der ertse und der lettze Buhcstbaen stmimt. Der Rset knan In eienm völilegen Duchrienanedr sein und knan trtozedm prboelmols gelseen wreden. Gunrd ist, dsas das menchsilche Ague nicht jeedn Buhcstbaen liset.

E um cartoon sobre o assunto de Der Spiegel (de Raymond Noë).

Obrigado a Vaclav Janca por passar isso adiante. Você também pode baixar o texto checo.

Svmkmaæt rnsanókn við Cmabrigde hkóásla þá stkpiir ekki mlái í hðvaa röð stfiar í oðri eru, það enia sem stikipr mlái er að frtsyi og stíasði stinaurfn séu á rtéutm satð. Aillr hniir sfitarnir gtea vireð í aöljrgu rlgui en þú gtuer smat lseið það aðvuledlgea. Áæðsatn fiyrr þsesu er að mnnashgrniuun les ekki hevrn satf friyr sig hleudr oirðð sem hiled.

Obrigado a Suzanne Buerger por encaminhar isso.

Português (brasileiro):

De aorcdo com uma pesqiusa de uma uinrvesriddae ignlsea, não ipomtra em qaul odrem as lrteas de uma plravaa etãso, a úncia csioa iprotmatne é que a piremria e útmlia lrteas etejasm no lgaur crteo. O rseto pdoe ser uma ttaol bçguana que vcoê pdoe anida ler sem pobrlmea. Itso é poqrue nós não lmeos cdaa lrtea isladoa, mas a plravaa cmoo um tdoo.

Agradeço ao Zé do Rock por me enviar isso.

En vestenkalpig unsdernöking gjord vid ett untivseriet i Enlgand har visat att utfiall de två fösrta och de två sista botskevärna i alla orden i en text är ritkigt plessarade, spelar det liten roll i vikmerjord de vikmerjindslöfdena ​​i boskevärna. Tetxen är fullt läbsar t.o.m. om de andra bokestävrna kommer hullorebmuller! Detta eftorsem vi inte läser varje enkisld botksav, utan ser bidlen av ordet som helhet.

Obrigado a Hakan Kjellerstrand por passar isso adiante. Aparentemente, isso foi postado pela primeira vez no dia 1º de setembro, aqui. Como a versão dinamarquesa, esta na verdade tem as duas primeiras e últimas letras fixas - que é mais semelhante à tese de doutorado de Graham Rawlinson e à carta que ele escreveu para a New Scientist. Não me surpreenderia se essa mudança de duas para uma letra externa sendo corrigida fosse uma mudança relativamente tardia para o meme.

Bahasa Indonésia:

Menuurt sbeauh penilitean di Cmabrigde Uinervtisy, tdaik mejnadi maslaah bgaimanaa urtaun hufur-hufur di dlaam sebauh kaat, ynag palngi pnteing adlaah leatk hruuf partema dan terkhair itu bnaer. Siasnya dpaat brantaaken saam skelai dan kmau maish dpaat mebmacanya tnpaa msaalah. Hal ini kerana aveia masunia tdaik mambeca seitap huurf msaing-msaing, tatepi kaat kesuleruhan.

Agradeço a Frederik Rotty por me enviar isso por e-mail.

Agradeço a Anastassia Kerr por passar isso para mim. Se desejar, você também pode baixar o texto em russo como um arquivo MS-Word.

Saips NJE siumtdi të Bere nga NJE utsveneiirt algenz, Per lxmeiin e fajlëve nuk ka rëndësi rjtnidea e srjahknove.Maotfjn qe skojnrha e Paré dhe e fnduit të Jene në vndeet e trye.Të tejrat mnud të Jene në NJE çregrullim të Polte dhe ne mnud të loxejmë pa polebrm.Kjo spese turri ynë nuk i loxen srojahknt një nga një, por fajlët si të polta.

Obrigado a Ymer Mulakaj por enviar isso.

Agradeço a Tamas Szepes por encaminhar isso para mim. Você também pode baixar a versão em húngaro como um arquivo rich text.

Da uno stdiuo dlela Camrbidge Urnievristy, l'oridne dllee letetre em una paorla non ha ipmotranza, la sloa csoa impoanrtte é che la pimra e l'ulmtia sinao nllea pozisione corttreta. Tttue le alrte letetre pososno esesre totamletne diosrdiante e tu sarai sepmre in grdao di legegre sezna prolbemi. Quetso é dovtuo al ftato che il cevrello umnao non lgege ongi letetra ma la paorla glolabmnete.

Obrigado a Alberto Castelnuovo por enviar este e-mail.

Irlandês (gaélico):

De riér tdgaihe ag Osllocil Cmabrigde é cmua cen tord atá ar na lriteahca i bhfacol má bhoínn an chaéd ltiir augs an liitr dhreineaach san áit chaert, augs an chiud elie em bpairseach. Is fiédir an taécs a thiucsint gan dua, ós rud é go lénan an itninn gcah fcoal ina imoliáne, ní liitr i ndaiidh litearch. Inotach.

Obrigado a Hanna Burdon por passar isso adiante. Você também pode baixar o texto em polonês no formato MS-Word.

aoccdrnig para um rscheearch em Cmabrigde Uinervtisy. De acordo com uma pesquisa (sic) na Universidade de Cambridge

Existem vários grupos em Cambridge, Reino Unido, fazendo pesquisas sobre idiomas. Tem o grupo onde trabalho (Unidade de Cognição e Ciências do Cérebro), também existem grupos do Departamento de Psicologia Experimental com destaque para o Centro de Fonoaudiologia (onde trabalhava). Há também pesquisadores de línguas em Fonética, Inglês e Linguística Aplicada, e na Anglia Polytechnic University.

Que eu saiba, não há ninguém em Cambridge, Reino Unido, que atualmente esteja fazendo pesquisas sobre esse tópico. Pode haver pessoas em Cambridge, MA, EUA que são responsáveis ​​por esta pesquisa, mas eu não as conheço. Se você souber de algo diferente, me avise [matt.davis & # 64 mrc-cbu.cam.ac.uk].

Encontrei uma página www que rastreou a demonstração original do efeito da randomização de cartas para Graham Rawlinson. Graham escreveu uma carta para a New Scientist em 1999 (em resposta a um artigo de Saberi & amp Perrot (Nature, 1999) sobre o efeito de reverter trechos curtos da fala). Você pode ler a carta aqui ou no link da New Scientist aqui. Nele Graham diz:

Isso me lembra meu PhD na Nottingham University (1976), que mostrou que a randomização de letras no meio de palavras teve pouco ou nenhum efeito na habilidade de leitores habilidosos de entender o texto. Na verdade, um leitor rápido notou apenas quatro ou cinco erros em uma página A4 de texto confuso.

É possível que, com a publicidade oferecida pela internet, a pesquisa do Dr. Rawlinson seja mais amplamente lida no futuro. Para aqueles que desejam citar isso em suas próprias pesquisas, a referência completa é:

Rawlinson, G. E. (1976) O significado da posição da letra no reconhecimento de palavras. Tese de PhD não publicada, Departamento de Psicologia, University of Nottingham, Nottingham UK.

Graham gentilmente me enviou um resumo de seu trabalho de tese.

não importa o que os alunos em um wrod estão, o velho iprmoetnt tihng é que o primeiro e o ltteer estejam na página direita.não importa a ordem das letras em uma palavra, a única coisa importante é que a primeira e a última letra estejam no lugar certo

Isso está claramente errado. Por exemplo, compare as seguintes três sentenças:

Todas as três sentenças foram randomizadas de acordo com as "regras" descritas no meme. A primeira e a última letras permaneceram no mesmo lugar e todas as outras letras foram movidas. Porém, suspeito que sua experiência seja igual à minha, de que os textos vão ficando cada vez mais difíceis de ler. Se você ficar preso, as frases serão vinculadas aos textos originais não embaralhados.

Esperançosamente, essas demonstrações o convenceram de que, em alguns casos, pode ser muito difícil entender frases com palavras confusas. Obviamente, a primeira e a última letra não são as únicas coisas que você usa ao ler o texto. Se esse fosse realmente o caso, como você diria a diferença entre pares de palavras como "sal" e "ripa"?

Vou listar algumas das maneiras pelas quais acho que o (s) autor (es) deste meme podem ter manipulado o texto confuso para torná-lo relativamente fácil de ler. Isso também servirá para listar os fatores que pensamos podem ser importantes para determinar a facilidade ou dificuldade de leitura de um texto confuso em geral.

Ainda há um debate muito real na psicologia da leitura, no entanto, sobre exatamente quais informações usamos durante a leitura. Não sei quanto dessa literatura o Dr. Rawlinson estava ciente na época de sua tese, mas acho que o texto confuso fornece uma ilustração clara de algumas das fontes de informação que agora consideramos importantes. Vou revisar algumas das pesquisas feitas para demonstrar isso.

o rset pode ser uma mensagem toatl e você pode sentar-se nele usando seu porbelm. o resto pode ser uma bagunça total e você ainda pode lê-lo sem problemas

Esta frase é, como o resto da demonstração, surpreendentemente fácil de ler, apesar de ser confusa. Como você viu acima, nem todas as frases distorcidas da mesma maneira são tão fáceis de ler. O que torna esta frase tão fácil? Meus colegas e eu sugerimos as seguintes propriedades:

1) Palavras curtas são fáceis - palavras de 2 ou 3 letras não mudam em nada. A única mudança que é possível em palavras de 4 letras é trocar a ordem das letras do meio, o que não causa muita dificuldade (ver 4).

2) Palavras funcionais (o, ser e, você etc.) permanecem iguais - principalmente porque são palavras curtas, consulte (1). Isso realmente ajuda o leitor, preservando a estrutura gramatical do original, ajudando você a descobrir qual palavra provavelmente virá a seguir. Isso é especialmente importante para a leitura de texto confuso - palavras previsíveis serão mais fáceis de ler nessa situação.

3) Das 15 palavras desta frase, 8 ainda estão na ordem correta. No entanto, como leitor, você pode não perceber isso, pois muitas das palavras que permanecem intactas são palavras funcionais, que os leitores tendem a não notar durante a leitura. Por exemplo, quando as pessoas são solicitadas a detectar letras individuais em uma frase, é mais provável que elas percam letras em palavras funcionais.

Healy, A. F. (1976). Detecção de erros na palavra o: Evidência para unidades de leitura maiores do que letras. Journal of Experimental Psychology: Human Perception & amp Performance, 2, 235-242.

4) Transposições de letras adjacentes (por exemplo. Porbelm para problema) são mais fáceis de ler do que transposições mais distantes (por exemplo Pborlem) Sabemos, por pesquisas em que as pessoas lêem palavras apresentadas muito brevemente na tela de um computador, que as letras externas das palavras são mais fáceis de detectar do que as do meio - confirmando uma das ideias presentes no meme. Também sabemos que as informações sobre a posição das letras no meio das palavras são mais difíceis de detectar e que os erros cometidos tendem a ser transposições.

McCusker, L. X., Gough, P. B., Bias, R. G. (1981) Reconhecimento de palavras de dentro para fora e de fora para dentro. Journal of Experimental Psychology: Human Perception and Performance, 7 (3), 538-551.

Uma explicação para essa propriedade do sistema de leitura é que ela resulta do fato de que a posição de uma letra exterior é menos facilmente confundida com letras adjacentes. Há apenas uma direção na qual uma letra externa pode se mover, e há menos letras adjacentes para 'mascarar' uma letra externa. Ambas as propriedades surgem muito naturalmente de um modelo de rede neural no qual as letras são identificadas em diferentes posições em uma retina artificial.

Shillcock, R., Ellison, T.M. & amp Monaghan, P. (2000). Comportamento de fixação ocular, armazenamento lexical e reconhecimento visual de palavras em um modelo de processamento dividido. Psychological Review 107, 824-851.

O relato proposto por Richard Shillcock e colegas também sugere outro mecanismo que poderia estar em funcionamento no meme. Eles propõem um modelo de reconhecimento de palavras em que cada palavra é dividida ao meio, já que a informação na retina é dividida entre os dois hemisférios do cérebro quando lemos. Em algumas das simulações de seu modelo, Richard Shillcock simula o efeito de letras embaralhadas em cada metade da palavra. Parece que manter as letras na metade apropriada da palavra reduz a dificuldade de leitura de texto confuso. Essa abordagem foi usada na geração do exemplo (1) acima, mas não para (2) ou (3).

5) Nenhuma das palavras com letras reordenadas cria outra palavra (wouthit vs witohut) Sabemos, por meio de trabalhos existentes, que palavras que podem ser confundidas trocando letras interiores (por exemplo, sal e ripa) são mais difíceis de ler. Para tornar uma palavra confusa fácil de ler, você deve evitar criar outras palavras.

Andrews, S (1996) Lexical retrieval and selection process: Effects of transposed-letter confusability. Journal of Memory and Language, 35 (6), 775-800.

6) Foram utilizadas transposições que mostram o som da palavra original (por exemplo Toatl vs ttaol para total) Isso ajudará na leitura, uma vez que muitas vezes prestamos atenção ao som das palavras, mesmo quando lendo para o significado:

Van-Orden, G. C. (1987) A ROWS is a ROSE: Spelling, sound, and reading. Memory and Cognition, 15 (3), 181-198.

7) O texto é razoavelmente previsível. Por exemplo, dadas as primeiras palavras da frase, você pode adivinhar quais palavras vêm a seguir (mesmo com muito pouca informação das letras da palavra). Sabemos que o contexto desempenha um papel importante na compreensão da fala que é distorcida ou apresentada no ruído, o mesmo provavelmente é verdadeiro para o texto escrito que foi misturado:

Miller, G. A., Heise, G. A., & amp Lichten, W. (1951). A inteligibilidade da fala em função do contexto dos materiais de teste. Journal of Experimental Psychology, 41, 329-335.

Tihs é porque o huamn mnid deos não raed ervey lteter por istlef, mas o wrod como um wlohe. Isso ocorre porque a mente humana não lê todas as letras por si mesma pela palavra como um todo.

Duas idéias estão sendo sugeridas nesta frase. Essencialmente, o autor está correto, as pessoas normalmente não lêem cada letra de uma palavra individualmente - exceto em uma condição relativamente rara após lesão cerebral conhecida como leitura letra por letra, conforme descrito a seguir:

Warrington, E.K., & amp Shallice, T. (1980). Dislexia em forma de palavra. Brain, 103, 99-112.

Também há evidências que sugerem que a informação na forma de uma palavra inteira desempenha um papel importante na leitura. Por exemplo, "CaSe MiXiNg" retarda substancialmente a leitura:

Mayall, K., Humphreys, G.W., & amp Olson, A. (1997). Interrupção no processamento de texto ou carta? As origens dos efeitos de mistura de casos. Journal of Experimental Psychology: Learning, Memory, & amp Cognition, 23, 1275–1286.

No entanto, como o "formato da palavra" inclui informações sobre a posição das letras internas (especialmente onde elas contêm elementos ascendentes e descendentes), o formato da palavra será interrompido pelas transposições.

Após breves apresentações de palavras escritas, as pessoas geralmente são melhores em adivinhar que palavra viram, em vez de adivinhar as letras individuais dessa palavra (o "Efeito de superioridade da palavra"):

Reicher, G. M. (1969) Reconhecimento perceptivo como função da significância do material de estímulo. Journal of Experimental Psychology. 81 (2), 275-280.

No entanto, esta demonstração não implica que a leitura não envolva qualquer processo que ocorra no nível de letras individuais. Um artigo recente na Nature apresenta uma nova peça de evidência para processos de nível de letra na leitura de palavras:

Pelli, D. G., Farell, B., Moore, D.C. (2003) A notável ineficiência do reconhecimento de palavras, Nature, 423, 752-756.

Neste artigo, Pelli e colegas mostram que, ao ler palavras que foram distorcidas pela apresentação de cada letra em ruído visual (como uma televisão desafinada), os leitores não têm um desempenho tão bom quanto um 'observador ideal' que pode reconhecer palavras com base em sua forma sozinha. Em vez disso, seus participantes apenas se saíram tão bem quanto poderiam se estivessem reconhecendo palavras com base em suas letras individuais.

Claramente, o debate sobre se lemos usando informações de letras individuais ou de palavras inteiras está longe de terminar. Demonstrações da facilidade ou dificuldade de leitura de textos confusos parecem provavelmente desempenhar um papel importante em nossa compreensão desse processo. Por exemplo:

Perea, M., & amp Lupker, S. J. (2003). O jugde ativa TRIBUNAL? Efeitos de confusibilidade de letras transpostas em priming associativo mascarado. Memória e cognição.

Outro artigo extremamente relevante que acabou de me chamar a atenção é este:

Perea, M., & amp Lupker, S. J. (2003). Efeitos de confusibilidade de letras transpostas no priming de forma mascarada. Em S. Kinoshita e S. J. Lupker (Eds.), Masked priming: State of the art (pp. 97-120). Hove, Reino Unido: Psychology Press.

O que Perea e Lupker fizeram foi apresentar palavras para decisão lexical (esta é uma palavra real?) E medir os tempos de resposta para pressionar um dos dois botões (sim / não). Essas palavras-alvo são precedidas por apresentações muito breves (50 mseg) de outra sequência de letras, que é mascarada e, portanto, invisível para os participantes. No entanto, a influência dessa palavra mascarada pode ser mostrada nos tempos de resposta. Por exemplo, os tempos de resposta são mais rápidos se USHER for precedido por "uhser" do que se precedido por "ushre". Ou seja, as transposições da letra intermediária "primam" uma palavra vizinha mais do que as transposições das letras extremas. O mesmo fenômeno que está no cerne da demonstração anterior.

Eu ficaria muito grato por quaisquer comentários e sugestões que as pessoas tenham nesta página, seja qual for o seu nível de conhecimento. Tentarei atualizar esta página com mais informações sobre o meme da internet e sobre trabalhos relacionados à leitura, se houver interesse. Talvez um dia haja um grupo de pesquisadores da Universidade de Cambridge que fará uma descoberta científica ao estudar a leitura de um texto confuso.

Outros comentários:

1) Ted Warring postou um link para um algoritmo que é muito melhor do que humanos para decifrar texto embaralhado. Isso talvez não seja surpreendente - tenho certeza de que não sou a única pessoa por aí que usou um programa de computador para resolver um anagrama particularmente difícil.

2) Bruce Murray, da Auburn University, Alabama, EUA aponta a seguinte citação como representante de uma linha de pesquisa que mostra que erros ortográficos (e transposições de cartas) interrompem o processo de leitura:

"Independentemente da previsibilidade semântica, sintática ou ortográfica, o olho parece processar letras individuais. As interrupções nos movimentos oculares dos leitores adultos indicam que o sistema visual tende a detectar o menor erro ortográfico."

(de Adams, M. J. (1990) Beginning to Read: Thinking and Learning About Print. Cambridge, MA: MIT Press, p. 101)

Há uma questão interessante aqui que é que a impressão subjetiva de dificuldade que se obtém ao ler um texto confuso pode ser bem diferente de uma medida mais objetiva de dificuldade de leitura obtida usando um rastreador ocular (um dispositivo que mede o padrão dos movimentos oculares feitos quando as pessoas lêem o texto impresso).

Bruce também apontou que o texto original e algumas discussões foram postados na "Página de Referência de Lendas Urbanas".

Eu fiz um bom programa de código aberto em Visual Basic, este programa pode fazer a randomização de letras automaticamente para você. Ele randomiza apenas as letras do meio de uma palavra, não altera o lugar da primeira e da última letra, também caracteres especiais como vírgulas e pontos não são afetados. Você pode baixar o programa e fonte aqui:

Você precisará que os arquivos de tempo de execução do Visual Basic estejam em seu sistema se quiser executar o executável. A instalação desses arquivos pode ser encontrada aqui:

4) Clive Tooth encontrou o que pode ser a frase confusa mais ambígua (usando palavras como "sal", que se torna "ripa" quando transposta)

"As sprehas tinham ponits e patles"

Os sherpas tinham pitons e pratos.

Os modeladores tinham pontas e pregas.

Os serafins tinham pintos e pétalas.

Os sphaers tinham pinots e paletes.

Os sphears tinham potins e peltas.

Clive lista algumas das palavras mais obscuras neste conjunto de leituras possíveis:

paletas: paleae (uma parte de uma flor de grama)

sphaers, sphears: ambas as formas antigas de 'esferas'

5) Stephen Sachs escreveu um script CGI para misturar o texto. Simplesmente insira seu texto na página www e pressione o botão para um novo texto embaralhado.

Reconhecimentos:

Agradecimentos a Maarten van Casteren, Kathy Rastle e Tim Rogers pelos comentários e sugestões nesta página.


O sistema límbico do cérebro

O sistema límbico é um conjunto de estruturas cerebrais localizadas no topo do tronco cerebral e enterradas sob o córtex. As estruturas do sistema límbico estão envolvidas em muitas de nossas emoções e motivações, particularmente aquelas relacionadas à sobrevivência, como medo e raiva. O sistema límbico também está envolvido em sensações de prazer relacionadas à nossa sobrevivência, como aquelas experimentadas por comer e fazer sexo. O sistema límbico influencia tanto o sistema nervoso periférico quanto o endócrino.

Certas estruturas do sistema límbico também estão envolvidas na memória: duas grandes estruturas do sistema límbico, a amígdala e o hipocampo, desempenham papéis importantes na memória. A amígdala é responsável por determinar quais memórias são armazenadas e onde as memórias são armazenadas no cérebro. Pensa-se que essa determinação se baseia em quão grande é a resposta emocional que um evento invoca. O hipocampo envia memórias para a parte apropriada do hemisfério cerebral para armazenamento de longo prazo e as recupera quando necessário. Danos a essa área do cérebro podem resultar na incapacidade de formar novas memórias.

Parte do prosencéfalo conhecido como diencéfalo também está incluído no sistema límbico. O diencéfalo está localizado abaixo dos hemisférios cerebrais e contém o tálamo e o hipotálamo. O tálamo está envolvido na percepção sensorial e na regulação das funções motoras (ou seja, movimento). Ele conecta áreas do córtex cerebral que estão envolvidas na percepção sensorial e no movimento com outras partes do cérebro e da medula espinhal que também desempenham um papel na sensação e no movimento. O hipotálamo é um componente muito pequeno, mas importante, do diencéfalo. Ele desempenha um papel importante na regulação dos hormônios, da glândula pituitária, da temperatura corporal, das glândulas supra-renais e de muitas outras atividades vitais.


Problemas de acessibilidade com captchas de áudio

Os desafios de áudio têm sido a solução de fato para permitir a acessibilidade em conjunto com captchas visuais. Apesar de suas limitações de ser difícil para falantes não nativos, usuários de idades mais jovens, usuários com dificuldades de aprendizagem ou linguagem, nenhuma outra alternativa foi amplamente implementada.

Uma pesquisa de Chellapilla et al. argumenta que as Provas de Interação Amigáveis ​​aos Humanos (HIPs) devem se aproximar de uma taxa de sucesso de pelo menos 90%. Mas um estudo de usabilidade com seis participantes cegos no ReCAPTCHA do Google descobriu que eles conseguiram resolver apenas 46% dos desafios de áudio em uma média de 65 segundos. Um estudo de Bigham et al. com alunos cegos do ensino médio descobriram que nenhum deles foi capaz de resolver os captchas de áudio. Em um estudo subsequente com 89 usuários cegos, eles descobriram que os usuários alcançaram uma taxa de sucesso de apenas 43% na resolução de 10 CAPTCHAs de áudio populares.

No mesmo estudo de Bigham et al, também foi verificado que leitores de tela usados ​​por usuários cegos falam enquanto reproduzem CAPTCHAs de áudio. Conforme os usuários navegam até a caixa de resposta, o software de acessibilidade continua lendo a interface enquanto fala sobre o desafio de reprodução de áudio. Um desafio de áudio em reprodução não pausa para os usuários enquanto eles digitam sua resposta. Rever um CAPTCHA de áudio é complicado, muitas vezes exigindo que o usuário comece novamente do início. Além disso, reproduzir um CAPTCHA de áudio exige que os usuários naveguem para fora da caixa de resposta para acessar os controles do reprodutor de áudio.


Como melhorar as condições e a qualidade

Outros artigos nesta edição oferecem sugestões e considerações sobre rigor, reprodutibilidade e transparência que também são relevantes para as preocupações que levantamos. Focamos aqui os mecanismos para lidar com dados e erros estatisticamente orientados que parecem ter ocorrido em artigos publicados. A experiência indica que o tratamento de tais erros (supostos e confirmados) é aleatório, indevidamente lento, inconsistente e muitas vezes marcadamente socialmente inadequado (11, 80, 81). Assim, ambos oferecemos sugestões sobre como e como não lidar com esses erros.

Alguns Princípios e Práticas Sugeridos.

Comente estudos, dados, métodos e lógica, não autores.

O caso recente das críticas feitas contra o trabalho de um pesquisador proeminente (82) oferece alguns exemplos gritantes de indivíduos que vão além de comentar sobre o trabalho em si para criticar a pessoa em termos extremos (por exemplo, ref. 83). Como dissemos em outro lugar (84), na ciência, três coisas importam: os dados, os métodos usados ​​para coletar os dados (que lhes dão seu valor probatório) e a lógica que conecta os dados e métodos às conclusões. Todo o resto é uma distração. No entanto, na tentativa de contrariar os pontos de alguns autores ou estudos, alguns indivíduos recorrem a ad hominem argumentos, muitas vezes tentando minar a credibilidade dos argumentos atacando uma pessoa com base em experiência percebida (85) ou motivos presumidos, focando especialmente em fontes de financiamento (86). Esses ataques (38) não são novos (87) e permanecem como distrações da própria ciência. Em nossas opiniões, e na opinião de algumas sociedades científicas, tais ataques a colegas cientistas por motivos não científicos são antiéticos (Exemplos de denúncias de sociedades e associações Ad Hominem Ataques) Os cientistas muitas vezes são protegidos pela liberdade acadêmica e, nos Estados Unidos, os indivíduos recebem os direitos da Primeira Emenda para a liberdade de expressão. No entanto, as liberdades não são imunes a recursos legais ou sociais, como no caso em que um diretor executivo de biotecnologia foi condenado por fraude eletrônica por um comunicado de imprensa enganoso sobre um produto (88). Indivíduos envolvidos em ataques ad hominem no discurso científico devem estar sujeitos a censura.

Exemplos de denúncias de sociedades e associações Ad Hominem Ataques

“O assédio inclui discurso ou comportamento que não é bem-vindo ou é pessoalmente ofensivo, seja baseado em ... qualquer outro motivo não relacionado ao mérito científico” (89).

“Tentar desacreditar opiniões científicas ou indivíduos apenas com base em relações de colaboração e / ou fontes de financiamento não tem lugar no processo científico” (90).

“Em um ambiente profissional, é melhor evitar argumentos ad hominem e ataques pessoais, especialmente se eles equivalem a calúnia, difamação e / ou assédio sexual” (91).

“A crítica da linguagem, ideias ou lógica de outra pessoa é uma parte legítima da pesquisa acadêmica, mas os pesquisadores éticos evitam ataques ad hominem” (92).

“Diferenças de opinião e desacordos ... não constituem, por si só, necessariamente, os indivíduos envolvidos em assédio devem, no entanto, se esforçar para ser respeitosos e abster-se de comentários ad hominem” (93).

Respeitosamente, levante possíveis preocupações sobre erros de invalidação (ou má conduta plausível) e permita o devido processo.

Se um erro invalidante ou má conduta ocorreu, acreditamos que a melhor maneira de proceder é relatar a preocupação em particular para alguma combinação do autor, do editor do periódico ou da instituição do autor. Os cientistas devem participar do processo privado e devido de adjudicação e, se apropriado, corrigir o erro alegado rapidamente. Mesmo que posteriormente seja considerado infundado, meramente a alegação de um erro invalidante grave ou, pior ainda, má conduta, pode manchar permanentemente indivíduos ou obras importantes (94, 95). “Teste por blog” não é uma maneira de julgar o conhecimento científico ou a reputação e carreira de cientistas individuais. Não sugerimos que o discurso público sobre a ciência, e particularmente os erros potenciais ou pontos de esclarecimento, devam ser sufocados. Plataformas de discussão pós-publicação, como PubPeer, PubMed Commons e seções de comentários de periódicos, levaram a conversas úteis que aprofundam a compreensão dos leitores sobre os artigos, trazendo à tona divergências importantes no campo. As plataformas públicas informais infelizmente levaram ao ridículo público [por exemplo, uma postagem agora removida (96)], e até mesmo a batalhas legais por aqueles que foram objeto de discussão pública (97). O decoro profissional e o devido processo são requisitos mínimos para um sistema de revisão por pares funcional e, portanto, parece justo que essas normas funcionem também na revisão por pares pós-publicação. Conforme discutido nesta edição e em outros lugares (81), os erros potenciais devem ser adequadamente identificados, verificados e corrigidos, protegendo ao mesmo tempo aqueles que levantam os erros de boa fé e aqueles que estão sendo acusados ​​de cometer erros honestos. O foco deve permanecer na ciência.

Desenvolver e utilizar procedimentos uniformes para lidar com erros de invalidação alegados em tempo hábil.

Nosso apelo ao decoro profissional e ao devido processo legal é, reconhecidamente, um tanto idealista. Como relatamos em outro lugar (11), o processo de correção de erros, mesmo quando passa pelos canais adequados com os periódicos, é freqüentemente uma combinação de absurdamente lento, inepto, confuso, caro, demorado e insatisfatório. Artigos declarados pelos editores como contendo conclusões patentemente incorretas podem permanecer não retratados se um autor se recusar a retratar (98). Artigos retratados devido a erros em um periódico são republicados com os mesmos erros em outros periódicos (99). Os periódicos podem levar mais de um ano para resolver um problema, deixando de manter os indivíduos envolvidos informados sobre o progresso ou de fornecer prazos específicos. Os editores podem revogar sua responsabilidade por resolver reivindicações de erros de invalidação (100), deixando para equipes de autores fazerem casos em cartas opostas (por exemplo, refs. 101 e 102) e provavelmente deixando os leitores confusos. Parece essencial que a comunidade científica se reúna para promulgar melhores procedimentos para lidar com as preocupações sobre a invalidação de erros. O proposto Comitê Consultivo de Integridade em Pesquisa (103), combinado com o Comitê de Ética em Publicações e o Comitê Internacional de Editores de Revistas Médicas podem ser órgãos orientadores pelos quais isso pode ser realizado. Até que tais procedimentos estejam em vigor e funcionando de forma expedita, pensamos que alguns cientistas ainda podem se sentir compelidos a abordar suas preocupações publicamente, e aqueles que são acusados ​​de delitos podem buscar orientação sobre como responder às acusações (104).

Soluções potenciais.

Trazer melhorias para o empreendimento científico exigirá abordagens variadas e vigilância constante de várias partes interessadas. As soluções sugeridas freqüentemente têm sido aumentar a conscientização ou aumentar a educação. Embora admitir que temos um problema seja o primeiro passo para consertá-lo, a ciência é um esforço humano, e os cientistas comportamentais demonstraram como é difícil efetuar mudanças no comportamento e nas atitudes habituais. Assim como a própria ciência, as soluções continuarão a evoluir e exigirão o envolvimento e a coordenação de várias partes interessadas. Felizmente, ferramentas melhores estão evoluindo.

Considerações para a educação.

Abordagens educacionais são freqüentemente recomendadas como formas de corrigir problemas na ciência. Na verdade, nosso comentário de que muitos erros que vemos podem estar relacionados à ignorância parece sugerir que acreditamos que a educação é uma boa solução. Obviamente, se não aumentarmos a conscientização sobre os problemas e ensinarmos suas soluções, haverá pouca esperança de abordá-los. No entanto, existem desafios substanciais para a implementação de soluções educacionais. Acima de tudo, o rigor da pesquisa e os tópicos relacionados são partes de uma disciplina por direito próprio, portanto, simplesmente adicioná-los aos currículos é impraticável em muitas situações. Os currículos das universidades lutam para acomodar tudo o que pode ser exigido para ser ensinado, com várias subdisciplinas pressionando por mais representação em programas já inchados. Adicionar cursos adicionais sobre projeto de estudo, inferência lógica, gerenciamento de dados, análise estatística e outros tópicos que são importantes para o rigor e a reprodutibilidade podem exigir difíceis compensações curriculares ou de compromisso de tempo.

Uma abordagem para as preocupações conflitantes de tempo e educação necessária é incorporar componentes em um currículo sinérgico, onde os tópicos poderiam ser melhor integrados aos cursos existentes. Isso foi tentado, por exemplo, incorporando a escrita em cursos de laboratório, talvez incorporando lógica, análise estatística, integridade de dados ou projeto de estudo em outros cursos também poderia funcionar. Como alternativa, preparar melhor os alunos para atuar em uma equipe verdadeiramente interdisciplinar pode aliviar a necessidade de um conhecimento profundo de tudo. Se os cientistas de laboratório fossem treinados para estar familiarizados, em vez de funcionalmente proficientes, nas análises estatísticas, talvez pudessem colaborar melhor com um estatístico. Essa divergência de experiência foi recontada, mesmo que apócrifamente, em um fórum de discussão da American Statistical Association: Um neurocirurgião liga para o departamento de consultoria estatística para informá-los: "Estou fazendo um estudo e prefiro apenas fazer minhas próprias estatísticas. Então, não preciso da sua ajuda, só me pergunto se você pode sugerir um bom texto de estatísticas. ” O estatístico da consultoria diz: “Que bom que você ligou! Eu sempre quis fazer uma cirurgia no cérebro, você pode sugerir um bom texto sobre isso? " (105)

Além disso, se a educação não for acompanhada por outras mudanças estruturais, as prioridades concorrentes podem ofuscar o conhecimento adquirido. Muitos erros estatísticos já são abordados em cursos obrigatórios e, no entanto, persistem.

Considerações para funções de “porteiro”.

As funções de gatekeeper criam circunstâncias nas quais as pessoas não têm escolha a não ser "fazer a coisa certa". Tais soluções já foram implementadas em diversos domínios, como requisitos para registro de ensaios. Requisitos para depósito de dados brutos e publicação de código estatístico foram implementados por alguns periódicos. Alguns financiadores e contratos exigem a publicação de resultados, como no caso de estudos registrados em ClinicalTrials.gov. Uma coisa que essas funções têm em comum é aumentar a quantidade de informações relatadas - “maior transparência”. Afinal, é difícil identificar erros se não forem fornecidas informações suficientes para avaliar a ciência.

Essas funções de gatekeeper são importantes para forçar algumas ações. No entanto, sem a aceitação intrínseca de mudanças culturais ou incentivos extrínsecos, os pesquisadores podem cumprir apenas dentro da letra dos requisitos, ao invés do espírito de rigor pretendido. Restringir os requisitos muito pode arriscar a criação de um sistema que deixará de ser flexível o suficiente para acomodar uma variedade de áreas científicas. Além disso, alguns investigadores lamentaram que gastem, em média, quase metade do seu tempo em tarefas administrativas (106). As funções de gatekeeping podem aumentar esse fardo e têm sido criticadas como a burocratização da ciência (107). Os encargos podem ser aliviados por recursos adicionais, como novas funções de trabalho adaptadas aos requisitos das instituições, da mesma forma que uma abordagem interdisciplinar alivia a necessidade de um único cientista ser um polímata.

Considerações para sistemas de incentivos.

Os incentivos e desincentivos vão além de permitir a passagem pelas funções de porteiro. Ter permissão para publicar após cumprir as restrições do porteiro dificilmente é uma recompensa. Os incentivos envolvem recompensas, classificações e classificações que fornecem reconhecimento pelo trabalho bem executado. Receber distintivos para práticas de ciência aberta (por exemplo, por meio da Badge Alliance) é uma abordagem para a motivação extrínseca por meio do reconhecimento. Essas recompensas podem precisar de reforço adicional além do reconhecimento passivo da comunidade, como inclusão nas decisões de posse e promoção.

Sistemas desincentivos também podem ser empregados. Por exemplo, o National Institutes of Health pode reter o financiamento se os estudos associados ao seu financiamento não estiverem em conformidade com o acesso público - isso também pode ser considerado uma função de guardião, no entanto, os investigadores sendo multados por não submeterem os resultados ao ClinicalTrials.gov podem ser considerados um desincentivo.

Incentivos e desincentivos podem resultar em "enganar o sistema". Esses incentivos recentemente questionados, como o reconhecimento pela publicação em periódicos de alto fator de impacto, resultaram em periódicos que aumentaram artificialmente seu fator de impacto por meio de vários meios de aumentar as autocitações (108). Em qualquer grande empresa, o comportamento pode, na melhor das hipóteses, ser melhorado de forma incremental. Os processos precisam ser resilientes à manipulação e não devem substituir a avaliação crítica dos resultados da pesquisa.

Considerações para aumentar os recursos.

A necessidade de aumentar os recursos para melhorar o rigor e a reprodutibilidade também é um refrão comum. Se as soluções de educação, porteiro e incentivo devem ser realizadas, eles precisarão de financiamento, pessoal e adesão adequados das partes interessadas. No entanto, aumentar os recursos para o rigor significa que os recursos podem ser retirados de outros empreendimentos, a menos que a sociedade aumente os recursos in toto (como por meio de impostos) ou soluções criativas sejam implementadas.

A redistribuição de recursos para reforçar a pesquisa rigorosa pode se pagar. Em vez de muitos estudos pequenos, insuficientes e não randomizados, ou coleta de dados de pesquisa transversal com uma variedade de questionários discordantes e não validados, poderíamos reunir recursos para consórcios para fornecer um conhecimento mais útil, completo e confiável, especialmente para teste probatório, de hipóteses pesquisar. Isso não significa subestimar o trabalho exploratório, mas com muita frequência, o trabalho exploratório ou os estudos-piloto e de viabilidade são apresentados como testes de hipóteses, em vez de gerar pesquisas. Essa mudança de cultura poderia aliviar a carga fiscal de reforçar o rigor e melhorar os ganhos em conhecimento com o enriquecimento de nosso corpus de pesquisa com evidências de alta qualidade.

Com o tempo, muitas soluções propostas devem ganhar eficiência. De fato, várias diretrizes de relatórios de melhores práticas (por exemplo, as diretrizes de Padrões Consolidados de Ensaios de Relatórios para testes em humanos ou as diretrizes de Pesquisa Animal: Relatórios de Experimentos In Vivo para estudos em animais) foram simplificadas para uso por periódicos, exigindo menos esforço de implementação.

Considerações para mudanças na cultura científica.

Aumentar a motivação intrínseca para conduzir ciência rigorosa é a pedra angular de nossas considerações propostas. As outras considerações que apresentamos dependem de os indivíduos terem a motivação intrínseca para buscar a verdade e ver a ciência como sua vocação ou paixão, em vez de apenas "um trabalho". Sem uma dedicação para encontrar os próprios erros, os cientistas podem não buscar educação, podem contornar as funções de gatekeeper, podem jogar incentivos ou podem desperdiçar recursos em favor de outras prioridades.

A normalização da correção de erros é necessária para o avanço da empresa. Alguns sugeriram retirar ou substituir a palavra abrangente “retratação” (que evoca “má conduta”) por descrições mais significativas de correção (109). “Retratação e republicação” poderiam ser usadas tanto para manter o registro histórico quanto para corrigir a literatura científica (110). Se a ciência deve ser autocorretiva, encorajar os autores a serem participantes ativos no processo de correção é essencial, e o estigma deve ser minimizado em casos de erros honestos.

Da mesma forma, reconhecer os cientistas por sua contribuição ao processo de controle de qualidade científica da revisão por pares pode ser uma mudança cultural importante. Os periódicos há muito listam os nomes dos revisores em declarações anuais de agradecimento, mas a revisão por pares às vezes é vista como um fardo - uma expectativa de serviço adicional sem remuneração - e pode ser relegada a uma nota de rodapé em alguns currículos. Um movimento no sentido de valorizar a revisão por pares levou à criação da Publons.

Se pudermos reforçar que a qualidade científica deve ser buscada acima de tudo em um empreendimento científico - ao invés de contracheques ou publicações, concessões ou grandeza - então acreditamos que melhorias virão em seguida.


2 respostas 2

Para alguns arquivos, uma verificação da proporção de bytes no intervalo ASCII imprimível ajudará. Se mais de 75% dos bytes estiverem nesse intervalo dentro das primeiras centenas de bytes, então provavelmente é 'legível'.

Alguns arquivos têm cabeçalhos, como as várias formas de BoM em arquivos UTF, o 0xA5EC que inicia os arquivos MS doc ou a assinatura "MZ" no início do .exe, que informará se o arquivo é legível ou não.

Muitos arquivos de texto modernos estão em um dos formatos UTF, que geralmente podem ser identificados lendo a primeira parte do arquivo, mesmo que não tenham um BoM.

Basicamente, você terá que percorrer vários tipos de arquivos diferentes para ver se há uma correspondência. Carregue o primeiro kilobyte do arquivo na memória e execute várias verificações diferentes nele. Depois de ter alguns dados, você pode solicitar as verificações para procurar os formatos mais comuns primeiro.

Em geral, você não pode fazer isso. Você pode usar um algoritmo de identificação de idioma para adivinhar se um determinado texto é um texto que poderia ser falado por humanos. Já que seu exemplo contém linguagens formais como html, entretanto, você está com sérios problemas. Se você realmente deseja implementar sua verificação para (um conjunto finito de) linguagens formais, pode usar um analisador GLR para analisar a gramática (ambígua) que combina todas essas linguagens. Isso, entretanto, ainda não resolveria o problema dos erros de sintaxe (embora seja possível definir uma heurística). Finalmente, você precisa considerar o que você realmente quer dizer com "legível por humanos": por exemplo, você inclui Base64?

editar: Caso você esteja interessado apenas no conjunto de caracteres: Veja a resposta a estas perguntas. Basicamente, você deve ler o arquivo e verificar se o conteúdo é válido em qualquer codificação de caractere que você considera legível por humanos (utf-8 deve abranger a maioria dos casos do mundo real).

F ώΚ σMΜΛLK-.Ρ K- * ΞΜΟ & # 179R0Τ3ΰεβε PK & # 178ξ & quot e, embora sejam caracteres gregos válidos, não serão D: & quot: - (& ndash fill & # x361pant & # x361 22 de junho de 2015 às 10:42


5 respostas 5

Na verdade, você tem vários métodos; é claro, você deve considerar que esses bots que coletam esse conteúdo estão essencialmente raspando todas as páginas que encontram e procurando padrões que se pareçam com endereços de e-mail. Como você disse, é meio que uma corrida armamentista e há nada impedindo que as pessoas que desenvolvem tais raspadores implementem esses métodos (espere, é por isso que você está perguntando?)

Você vai querer evitar criar um hiperlink fora do seu endereço de e-mail na maioria dos casos, e você certamente evite usar mailto: - que basicamente é anunciar para qualquer pessoa que esteja lendo a página "ei, sou um endereço de e-mail".

Vamos começar de uma maneira simples e agradável, espaçamento:

Obviamente, é um endereço de e-mail para um humano, parece um monte de letras aleatórias com espaços para um raspador. Não gosta de espaçamento? Muito menos comum, mas muito mais à prova de falhas, é converter seu endereço de e-mail em uma imagem. Ainda é legível por humanos, mas não será algo que a maioria dos scrapers de e-mail estão procurando, muito menos capaz de analisar.

Que tal converter sua pontuação (@ e ponto final) em seus equivalentes HTML (& amp # 64 e & amp # 46 respectivamente)?

Ele ainda parece um endereço de e-mail quando processado pelo navegador, mas não será tão difícil de contornar do ponto de vista da raspagem, já que você apenas procurará pelo & amp # 46 e & amp # 64 - mas por que parar aí? Por que não ir até o fim e apenas codificar todo o endereço de e-mail? Isso pode ser feito facilmente com uma ferramenta como o Mailto Encoder de Rumkin, de repente seu endereço de e-mail fica assim:

Isso ainda é renderizado como você esperaria em um navegador, mas é basicamente algo sem sentido no que diz respeito a qualquer raspador que não leve a codificação em consideração.

Você também pode fazer isso com CSS se quiser algo assim:


O efeito Stroop descreve um experimento sobre o tempo que leva para nomear a cor das palavras impressas. Quando você tenta nomear a cor na qual as palavras de cores são impressas, leva mais tempo quando a palavra da cor difere da cor da tinta do que quando a palavra da cor é igual à cor da tinta.

Para lhe dar uma ideia de como o efeito Stroop funciona, aqui está uma tarefa para você experimentar:

  1. Seguindo essa lista de instruções, há duas caixas cinza, cada uma contendo uma lista de palavras.
  2. As palavras aparecem em cores na tela.
  3. A tarefa é nomear a cor das letras de cada palavra (não ler as palavras).
  4. Tente nomear cada cor o mais rápido possível.


vermelho verde azul amarelo preto branco amarelo azul preto verde branco vermelho


branco preto amarelo verde azul vermelho preto amarelo branco azul verde vermelho

Nomear as cores foi muito mais difícil para a segunda caixa, certo? Você pode até ter sentido que estava lutando contra a vontade de ler a palavra da cor em voz alta, em vez de nomear a cor das letras. Esse fenômeno foi descrito em 1935 em um artigo agora famoso de John Ridley Stroop, e é conhecido na psicologia experimental como o efeito Stroop. Uma explicação para o efeito Stroop é chamada interferência. Desde os primeiros anos de escola, a leitura é uma tarefa que as pessoas praticam todos os dias. Tornamo-nos tão bons nisso que lemos as palavras automaticamente. Quando somos solicitados a nomear a cor do a palavra em vez de ler a palavra, de alguma forma a leitura automática da palavra interfere na nomeação da cor da palavra.

Esta experiência explora o que você pode fazer para alterar a apresentação da palavra a fim de eliminar o efeito Stroop. Por exemplo, se você imprimir as palavras na forma de um círculo, isso torna a leitura da palavra lenta o suficiente para que o efeito de interferência seja reduzido ou cancelado? Faz diferença se as letras estão no sentido horário ou no sentido anti-horário? A Figura 1 abaixo tem exemplos para mostrar o que queremos dizer, e a seção de Procedimento Experimental tem um arquivo pdf que você pode baixar e imprimir (requer Adobe Acrobat).

Quatro fileiras de letras soletrando uma cor e dispostas em um círculo com as cores de referência abaixo: marrom, verde, roxo, vermelho e azul (da esquerda para a direita). A primeira linha contém palavras no sentido horário que correspondem à cor da tinta de referência. A segunda linha contém palavras no sentido horário com cores de tinta não correspondentes. A terceira linha contém palavras no sentido anti-horário com cores de tinta correspondentes. A quarta linha contém palavras no sentido anti-horário com cores de tinta não correspondentes.

Figura 1. Exemplos de cinco diferentes estímulos de teste de palavras 'distorcidas'. A primeira linha contém palavras no sentido horário que correspondem à cor da tinta. A segunda linha contém palavras no sentido horário com cores de tinta não correspondentes. A terceira linha contém palavras no sentido anti-horário com a cor de tinta correspondente. A quarta linha contém palavras no sentido anti-horário com cores de tinta não correspondentes.

A distorção das palavras em um círculo impedirá a leitura automática e o efeito de interferência que a acompanha? Faz diferença se as letras estão organizadas no sentido horário ou anti-horário? Experimente esta experiência para descobrir!


Por que a instrução de compreensão por meio da tomada de perspectiva é importante?

Compreender a literatura e entender as pessoas extraem de muitas das mesmas habilidades, particularmente devido à tomada de perspectiva, mais precisamente denominada como teoria da mente (Pelletier & amp Astington, 2004). Consequentemente, os leitores usam experiências da vida real para entender os personagens da história e usam o insight do mundo imaginado dos personagens da história para navegar melhor em seu mundo real. Por exemplo, os adultos que lêem ficção com frequência mostram uma empatia mais forte do que os leitores de não ficção (Mar, Oatley & amp Peterson, 2009). Ainda mais surpreendente, as intervenções que exigem que os adultos leiam a literatura podem melhorar as habilidades de empatia (Djikic, Oatley, & amp Moldoveanu, 2013). Em suma, o estereótipo do leitor ávido anti-social está sendo desmascarado (Mar, Oatley, Hirsh, dela Paz, & amp Peterson, 2006).

Infelizmente, pesquisas limitadas exploraram como a literatura pode ajudar a desenvolver infantil habilidades sociais, embora Lobron e Selman (2007) defendam que a coordenação de perspectiva ensinada por meio da literatura fornece uma base para a consciência social. Essa ideia compartilha características com a biblioterapia (por exemplo, Pehrsson, 2005), quando as histórias são usadas para ajudar as crianças a lidar com eventos traumáticos, como a perda de um dos pais. Biblioterapia geralmente aborda uma crise, no entanto. Em contraste, defendemos que a ficção também pode ser usada proativamente como um campo de treinamento para praticar a tomada de perspectiva e a análise de conflitos. Idealmente, os alunos podem usar o insight da ficção para desenvolver habilidades interpessoais que lhes permitem resolver, em vez de intensificar, os conflitos.

Habilidades de tomada de perspectiva também apoiam diretamente o desenvolvimento da alfabetização, particularmente compreensão e motivação de ordem superior. Assim, o Estágio Quatro de Chall (1983) de desenvolvimento da alfabetização é leitura para múltiplos pontos de vista na literatura e em textos informativos. A compreensão inferencial exige claramente o uso de conhecimento além do texto para compreender as ações e motivos dos personagens. Além disso, a alfabetização crítica exige que os leitores considerem questões como “Que visão de mundo é apresentada pelas ideias neste texto? Quais visualizações não são? ” (Cervetti, Pardales & amp Damico, 2001). Essas questões desafiadoras exigem que os leitores considerem os objetivos dos outros, especialmente os do autor. Uma meta-análise recente mostra que mesmo simplesmente instruir os leitores a adotar perspectivas alternativas enquanto lêem as narrativas pode melhorar a compreensão (Yeh & amp McTigue, 2013).

Finalmente, como o engajamento para a leitura é um estado emocional, a instrução da leitura deve considerar tanto as habilidades cognitivas quanto as emoções para construir a motivação (Guthrie & amp Wigfield, 2000). Portanto, se pudermos ajudar os alunos a se conectar com os personagens por meio da adoção de perspectiva e empatia, isso fornecerá motivação para persistir. Simplificando, os alunos vão querer saber o que acontece no final!


Materiais e métodos

Participantes.

Participaram deste estudo 18 indivíduos destros [média de 11 mulheres (M) = 22,2 anos] com visão normal ou corrigida para normal. A destreza forte foi verificada com uma forma modificada do Annett Handedness Questionnaire (Annett, 1970). Todos os participantes eram falantes nativos de inglês e não haviam aprendido nenhum outro idioma antes dos cinco anos. Nenhum participante indicou qualquer deficiência de aprendizagem ou qualquer histórico de distúrbios neurológicos ou psiquiátricos. Os participantes foram recrutados em universidades locais, por meio do Centro de Neurociência Cognitiva da Universidade da Pensilvânia. De acordo com o Comitê de Revisão Institucional da Universidade da Pensilvânia, todos os participantes forneceram consentimento informado e foram remunerados monetariamente pela participação.

Medida do estilo cognitivo verbal e visual autorreferido.

Uma versão computadorizada do Verbalizer-Visualizer Questionnaire revisado (Kirby et al., 1988) foi administrada para avaliar o grau em que os participantes empregam o raciocínio visual e verbal em tarefas e situações comuns. O VVQ (seguindo modificações desenvolvidas por Kirby et al., 1988) consiste em 10 afirmações relacionadas a um estilo de raciocínio verbal e 10 relacionadas a um estilo de raciocínio visual (10 questões adicionais avaliam uma terceira dimensão de "vivacidade dos sonhos" que não foi incluída em análise posterior). Os participantes classificaram cada afirmação em uma escala discreta de cinco pontos de concordo totalmente (5) a discordo totalmente (1). As pontuações para as afirmações visuais e verbais foram calculadas separadamente, onde somamos as respostas de todas as 10 questões dentro daquela dimensão. As cinco perguntas formuladas positivamente receberam pontuações positivas, enquanto as cinco perguntas formuladas negativamente receberam pontuações negativas, criando assim uma gama de pontuações possíveis de -20 a 20. O questionário foi apresentado em um computador usando o software E-Prime (Ferramentas de Software de Psicologia) , com o texto aparecendo em preto sobre um fundo branco.

Testes objetivos de habilidades cognitivas visuais e verbais.

Subtestes da Escala de Inteligência de Adultos de Wechsler (WAIS), Terceira Edição (Wechsler, 1997), foram usados ​​para avaliar a habilidade de raciocínio visual e verbal. Administramos seis subtestes consecutivamente: preenchimento de imagem, vocabulário, semelhanças, desenho de blocos, raciocínio de matriz e informações. As pontuações do Índice de Compreensão Verbal (VCI) foram calculadas a partir do desempenho no vocabulário, semelhanças e informações. As pontuações do Perceptual Organization Index (POI) foram calculadas a partir do desempenho na conclusão da imagem, desenho do bloco e raciocínio da matriz.

Tarefa de julgamento de similaridade.

Os participantes completaram uma tarefa de julgamento de similaridade durante a fMRI. Conforme mostrado na Figura 1, cada item nesta tarefa consistia em uma imagem (por exemplo, um triângulo vermelho com listras) ou um conjunto de três palavras que nomeavam uma forma, cor e padrão (por exemplo, vermelho, listras, triângulo). Havia cinco atribuições de atributos possíveis para cada uma das três características que compunham cada item.

Em cada ensaio experimental, os participantes primeiro viram um item-alvo (imagem ou palavras) no centro da tela por 1500 ms. Posteriormente, dois itens de sondagem (duas imagens ou dois conjuntos de palavras) apareceram por 3.500 ms antes de desaparecerem. Como os alvos e sondas podiam ser apresentados como imagens ou palavras, havia quatro condições de teste dentro do sujeito: imagem-imagem, palavra-palavra, imagem-palavra e palavra-imagem. Os participantes completaram 30 tentativas de cada uma dessas quatro condições. Nenhum conjunto de três itens (alvo e duas sondas) jamais foi repetido dentro ou entre os tipos de condição.

Quando os itens da sonda apareceram, os participantes indicaram por meio do pressionamento do botão qual das duas sondas era mais semelhante ao alvo anterior. Os participantes tiveram 3.500 ms para responder antes que as sondas desaparecessem. As sondas foram então imediatamente substituídas por uma cruz de fixação central por 1 s. Em metade das tentativas experimentais, a resposta correta foi a ponta de prova esquerda, e na outra metade das tentativas experimentais, a resposta correta foi a ponta de prova direita. As pontas de prova corretas continham dois dos três recursos em comum com os itens incorretos de destino continham apenas um recurso em comum. Esta regra não foi declarada explicitamente aos participantes, em vez disso, o feedback foi dado em várias tentativas práticas e todos os participantes demonstraram proficiência na tarefa antes do início da primeira execução. Os dados do piloto indicaram que os estímulos representados como imagens tinham alta concordância de nomes com os rótulos verbais associados.

Coleção de dados.

A participação envolveu duas sessões experimentais. Não se passaram mais de 2 semanas entre as duas sessões. Na primeira sessão, os participantes forneceram consentimento informado e, em seguida, completaram os subtestes WAIS, seguidos de um Questionário de Vivacidade de Imagens Visuais (Marks, 1973) e, finalmente, o VVQ. A administração desta sessão durou ∼1 h.

Na segunda sessão, os participantes completaram a tarefa de julgamento de similaridade durante a varredura de fMRI. Após a conclusão das tentativas práticas e uma varredura anatômica, o participante concluiu a tarefa experimental. No total, esta sessão durou ∼40 min. Por causa da falha do equipamento, os dados não foram coletados durante a varredura funcional para uma execução de um dos participantes. Para todos os outros participantes, três execuções funcionais completas foram coletadas. Consulte o material suplementar, disponível em www.jneurosci.org, para obter mais detalhes sobre a coleta e análise de dados de fMRI.

Um projeto estocástico relacionado a eventos foi implementado em que todas as quatro condições experimentais (imagem-imagem, palavra-palavra, imagem-palavra, palavra-imagem), bem como períodos de fixação de 6 segundos instáveis, foram misturados de forma pseudo-aleatória em três execuções de 8 min cada. Dez tentativas de cada uma das condições experimentais apareceram em cada corrida, e vinte tentativas de fixação de 6 s também foram incluídas em cada corrida.

Cada um dos 60 ensaios de fixação durou 6 se foram, de resto, idênticos à fixação de 1 s que apareceu no final de cada ensaio experimental. Durante a análise, os testes de fixação de 6 s foram divididos em duas condições, metade dos testes de fixação foram usados ​​como linha de base (não modelados) e a outra metade foi usada como condição de controle. Isso foi feito para que pudéssemos avaliar a atividade cerebral durante um conjunto de períodos de fixação, conforme rastreado com nossas variáveis ​​preditoras paramétricas (pontuações VVQ). Como os testes de fixação de 6 s foram misturados pseudo-aleatoriamente entre outros testes (e às vezes apareceram em sucessão), fomos capazes de limitar a quantidade de covariância entre os testes de fixação usados ​​para a linha de base, os testes de fixação usados ​​para a análise paramétrica e os testes experimentais (Friston et al., 1999).

Duas outras tarefas também foram realizadas nas mesmas execuções e foram originalmente concebidas como possíveis condições de controle adicionais. Isso consistia em duas tarefas nas quais os participantes simplesmente pressionavam um botão no início do estímulo visual. Um tipo de estímulo era um agrupamento abstrato de manchas de cores, usando as mesmas cores da condição da imagem. O outro tipo de estímulo consistia em pseudopalavras pronunciáveis, que os sujeitos também eram instruídos a ler para si mesmos durante a visualização. Essas tarefas não são discutidas mais adiante, pois eram desnecessárias para as análises presentes.

Antes da primeira execução, oito tentativas experimentais, compostas por duas tentativas de cada uma das quatro condições experimentais, foram fornecidas ao participante com feedback para garantir que cada participante entendeu as instruções da tarefa. Nenhum feedback foi dado durante a sessão de digitalização.


Visão Social

3.2.2 A área da face occipital

Embora o FFA tenha recebido atenção considerável por ser sensível ao rosto, há muitas outras áreas que também estão envolvidas no reconhecimento visual de rostos. Além disso, evidências crescentes sugerem que o FFA não é suficiente por si só para o reconhecimento de rostos. 148 Um exemplo vem de um paciente com lesão neurológica. Os pesquisadores 148 compararam o paciente D.F., que tinha prosopagnosia (incapacidade de reconhecer rostos) e danos ao córtex occipital lateral e região occipito-parietal medial, a controles da mesma idade. Comportamentalmente, o paciente D.F. foi capaz de realizar algumas tarefas faciais de nível inferior, como discriminar rostos de outros objetos não faciais, mas não conseguiu realizar tarefas faciais de nível superior, incluindo expressão e reconhecimento de identidade, ou classificação de gênero de rosto. Surpreendentemente, D.F. mostrou ativação quase normal no FFA em comparação com os controles. No entanto, D.F. não teve ativação na área do giro occipital inferior, denominado área da face occipital (OFA), devido a seus danos nessa área. Todos os controles mostraram ativação no OFA, presumivelmente permitindo que eles concluíssem tarefas faciais de nível superior que o D.F. não pôde ser concluído. Esses resultados sugerem que a atividade normal de FFA não equivale ao desempenho normal de identificação de rosto e que outras áreas devem estar envolvidas para funcionar normalmente.

O OFA não recebeu a análise extensiva que o FFA recebeu nas últimas duas décadas e, como tal, não se sabe tanto sobre a função específica do OFA na rede de processamento facial. O OFA geralmente está localizado no hemisfério direito, consistente com outras áreas sensíveis ao rosto. 149 Embora a região OFA tenha sido observada desde o advento do fMRI, foi Gauthier et al. 143, que cunhou o termo “área da face occipital” para a região do giro occipital. Mais tarde, o OFA foi estudado mais extensivamente e alguns afirmam que é um dos primeiros agentes de detecção visual na rede neural de processamento facial. 150,151 De fato, o OFA parece receber informações precocemente do córtex visual antes de ser analisado por áreas corticais superiores. 150,151 Ao longo dessas mesmas linhas, o OFA foi implicado em estar envolvido no processamento de alterações fluidas da face física, ao invés de sinais de identidade mais estáticos. 150 Mais recentemente, o OFA demonstrou ser seletivamente responsivo a partes do rosto, como olhos e boca. 149,152–154 Em um estudo usando estimulação magnética transcraniana (TMS), um dispositivo que distribui fortes pulsos magnéticos em áreas seletivas do cérebro, os pesquisadores produziram artificial e temporariamente o equivalente a lesões no OFA. 154 Como suspeito, desativar temporariamente o OFA resultou na incapacidade de discriminar partes do rosto, mas uma habilidade intacta de discriminar casas. Curiosamente, os pesquisadores realizaram outro estudo onde entregaram pulsos TMS em momentos variados após o início do estímulo. Eles mostraram que os pulsos fornecidos em 60 ms e 100 ms interromperam o processamento da parte do rosto, mas os pulsos em outros momentos não, sugerindo que o OFA está associado a processos de detecção precoce de rosto.


5 respostas 5

Na verdade, você tem vários métodos; é claro, você deve considerar que esses bots que coletam esse conteúdo estão essencialmente raspando todas as páginas que encontram e procurando padrões que se pareçam com endereços de e-mail. Como você disse, é meio que uma corrida armamentista e há nada impedindo que as pessoas que desenvolvem tais raspadores implementem esses métodos (espere, é por isso que você está perguntando?)

Você vai querer evitar criar um hiperlink fora do seu endereço de e-mail na maioria dos casos, e você certamente evite usar mailto: - que basicamente é anunciar para qualquer pessoa que esteja lendo a página "ei, sou um endereço de e-mail".

Vamos começar de uma maneira simples e agradável, espaçamento:

Obviamente, é um endereço de e-mail para um humano, parece um monte de letras aleatórias com espaços para um raspador. Não gosta de espaçamento? Muito menos comum, mas muito mais à prova de falhas, é converter seu endereço de e-mail em uma imagem. Ainda é legível por humanos, mas não será algo que a maioria dos scrapers de e-mail estão procurando, muito menos capaz de analisar.

Que tal converter sua pontuação (@ e ponto final) em seus equivalentes HTML (& amp # 64 e & amp # 46 respectivamente)?

Ele ainda parece um endereço de e-mail quando processado pelo navegador, mas não será tão difícil de contornar do ponto de vista da raspagem, já que você apenas procurará pelo & amp # 46 e & amp # 64 - mas por que parar aí? Por que não ir até o fim e apenas codificar todo o endereço de e-mail? Isso pode ser feito facilmente com uma ferramenta como o Mailto Encoder de Rumkin, de repente seu endereço de e-mail fica assim:

Isso ainda é renderizado como você esperaria em um navegador, mas é basicamente algo sem sentido no que diz respeito a qualquer raspador que não leve a codificação em consideração.

Você também pode fazer isso com CSS se quiser algo assim:


O efeito Stroop descreve um experimento sobre o tempo que leva para nomear a cor das palavras impressas. Quando você tenta nomear a cor na qual as palavras de cores são impressas, leva mais tempo quando a palavra da cor difere da cor da tinta do que quando a palavra da cor é igual à cor da tinta.

Para lhe dar uma ideia de como o efeito Stroop funciona, aqui está uma tarefa para você experimentar:

  1. Seguindo essa lista de instruções, há duas caixas cinza, cada uma contendo uma lista de palavras.
  2. As palavras aparecem em cores na tela.
  3. A tarefa é nomear a cor das letras de cada palavra (não ler as palavras).
  4. Tente nomear cada cor o mais rápido possível.


vermelho verde azul amarelo preto branco amarelo azul preto verde branco vermelho


branco preto amarelo verde azul vermelho preto amarelo branco azul verde vermelho

Nomear as cores foi muito mais difícil para a segunda caixa, certo? Você pode até ter sentido que estava lutando contra a vontade de ler a palavra da cor em voz alta, em vez de nomear a cor das letras. Esse fenômeno foi descrito em 1935 em um artigo agora famoso de John Ridley Stroop, e é conhecido na psicologia experimental como o efeito Stroop. Uma explicação para o efeito Stroop é chamada interferência. Desde os primeiros anos de escola, a leitura é uma tarefa que as pessoas praticam todos os dias. Tornamo-nos tão bons nisso que lemos as palavras automaticamente. Quando somos solicitados a nomear a cor do a palavra em vez de ler a palavra, de alguma forma a leitura automática da palavra interfere na nomeação da cor da palavra.

Esta experiência explora o que você pode fazer para alterar a apresentação da palavra a fim de eliminar o efeito Stroop.Por exemplo, se você imprimir as palavras na forma de um círculo, isso torna a leitura da palavra lenta o suficiente para que o efeito de interferência seja reduzido ou cancelado? Faz diferença se as letras estão no sentido horário ou no sentido anti-horário? A Figura 1 abaixo tem exemplos para mostrar o que queremos dizer, e a seção de Procedimento Experimental tem um arquivo pdf que você pode baixar e imprimir (requer Adobe Acrobat).

Quatro fileiras de letras soletrando uma cor e dispostas em um círculo com as cores de referência abaixo: marrom, verde, roxo, vermelho e azul (da esquerda para a direita). A primeira linha contém palavras no sentido horário que correspondem à cor da tinta de referência. A segunda linha contém palavras no sentido horário com cores de tinta não correspondentes. A terceira linha contém palavras no sentido anti-horário com a cor de tinta correspondente. A quarta linha contém palavras no sentido anti-horário com cores de tinta não correspondentes.

Figura 1. Exemplos de cinco diferentes estímulos de teste de palavras 'distorcidas'. A primeira linha contém palavras no sentido horário que correspondem à cor da tinta. A segunda linha contém palavras no sentido horário com cores de tinta não correspondentes. A terceira linha contém palavras no sentido anti-horário com a cor de tinta correspondente. A quarta linha contém palavras no sentido anti-horário com cores de tinta não correspondentes.

A distorção das palavras em um círculo impedirá a leitura automática e o efeito de interferência que a acompanha? Faz diferença se as letras estão organizadas no sentido horário ou anti-horário? Experimente esta experiência para descobrir!


Visão Social

3.2.2 A área da face occipital

Embora o FFA tenha recebido atenção considerável por ser sensível ao rosto, há muitas outras áreas que também estão envolvidas no reconhecimento visual de rostos. Além disso, evidências crescentes sugerem que o FFA não é suficiente por si só para o reconhecimento de rostos. 148 Um exemplo vem de um paciente com lesão neurológica. Os pesquisadores 148 compararam o paciente D.F., que tinha prosopagnosia (incapacidade de reconhecer rostos) e danos ao córtex occipital lateral e região occipito-parietal medial, a controles da mesma idade. Comportamentalmente, o paciente D.F. foi capaz de realizar algumas tarefas faciais de nível inferior, como discriminar rostos de outros objetos não faciais, mas não conseguiu realizar tarefas faciais de nível superior, incluindo expressão e reconhecimento de identidade, ou classificação de gênero de rosto. Surpreendentemente, D.F. mostrou ativação quase normal no FFA em comparação com os controles. No entanto, D.F. não teve ativação na área do giro occipital inferior, denominado área da face occipital (OFA), devido a seus danos nessa área. Todos os controles mostraram ativação no OFA, presumivelmente permitindo que eles concluíssem tarefas faciais de nível superior que o D.F. não pôde ser concluído. Esses resultados sugerem que a atividade normal de FFA não equivale ao desempenho normal de identificação de rosto e que outras áreas devem estar envolvidas para funcionar normalmente.

O OFA não recebeu a análise extensiva que o FFA recebeu nas últimas duas décadas e, como tal, não se sabe tanto sobre a função específica do OFA na rede de processamento facial. O OFA geralmente está localizado no hemisfério direito, consistente com outras áreas sensíveis ao rosto. 149 Embora a região OFA tenha sido observada desde o advento do fMRI, foi Gauthier et al. 143, que cunhou o termo “área da face occipital” para a região do giro occipital. Mais tarde, o OFA foi estudado mais extensivamente e alguns afirmam que é um dos primeiros agentes de detecção visual na rede neural de processamento facial. 150,151 De fato, o OFA parece receber informações precocemente do córtex visual antes de ser analisado por áreas corticais superiores. 150,151 Ao longo dessas mesmas linhas, o OFA foi implicado em estar envolvido no processamento de alterações fluidas da face física, ao invés de sinais de identidade mais estáticos. 150 Mais recentemente, o OFA demonstrou ser seletivamente responsivo a partes do rosto, como olhos e boca. 149,152–154 Em um estudo usando estimulação magnética transcraniana (TMS), um dispositivo que distribui fortes pulsos magnéticos em áreas seletivas do cérebro, os pesquisadores produziram artificial e temporariamente o equivalente a lesões no OFA. 154 Como suspeito, desativar temporariamente o OFA resultou na incapacidade de discriminar partes do rosto, mas uma habilidade intacta de discriminar casas. Curiosamente, os pesquisadores realizaram outro estudo onde entregaram pulsos TMS em momentos variados após o início do estímulo. Eles mostraram que os pulsos fornecidos em 60 ms e 100 ms interromperam o processamento da parte do rosto, mas os pulsos em outros momentos não, sugerindo que o OFA está associado a processos de detecção precoce de rosto.


Como melhorar as condições e a qualidade

Outros artigos nesta edição oferecem sugestões e considerações sobre rigor, reprodutibilidade e transparência que também são relevantes para as preocupações que levantamos. Focamos aqui os mecanismos para lidar com dados e erros estatisticamente orientados que parecem ter ocorrido em artigos publicados. A experiência indica que o tratamento de tais erros (supostos e confirmados) é aleatório, indevidamente lento, inconsistente e muitas vezes marcadamente socialmente inadequado (11, 80, 81). Assim, ambos oferecemos sugestões sobre como e como não lidar com esses erros.

Alguns Princípios e Práticas Sugeridos.

Comente estudos, dados, métodos e lógica, não autores.

O caso recente das críticas feitas contra o trabalho de um pesquisador proeminente (82) oferece alguns exemplos gritantes de indivíduos que vão além de comentar sobre o trabalho em si para criticar a pessoa em termos extremos (por exemplo, ref. 83). Como dissemos em outro lugar (84), na ciência, três coisas importam: os dados, os métodos usados ​​para coletar os dados (que lhes dão seu valor probatório) e a lógica que conecta os dados e métodos às conclusões. Todo o resto é uma distração. No entanto, na tentativa de contrariar os pontos de alguns autores ou estudos, alguns indivíduos recorrem a ad hominem argumentos, muitas vezes tentando minar a credibilidade dos argumentos atacando uma pessoa com base em experiência percebida (85) ou motivos presumidos, focando especialmente em fontes de financiamento (86). Esses ataques (38) não são novos (87) e permanecem como distrações da própria ciência. Em nossas opiniões, e na opinião de algumas sociedades científicas, tais ataques a colegas cientistas por motivos não científicos são antiéticos (Exemplos de denúncias de sociedades e associações Ad Hominem Ataques) Os cientistas muitas vezes são protegidos pela liberdade acadêmica e, nos Estados Unidos, os indivíduos recebem os direitos da Primeira Emenda para a liberdade de expressão. No entanto, as liberdades não são imunes a recursos legais ou sociais, como no caso em que um diretor executivo de biotecnologia foi condenado por fraude eletrônica por um comunicado de imprensa enganoso sobre um produto (88). Indivíduos envolvidos em ataques ad hominem no discurso científico devem estar sujeitos a censura.

Exemplos de denúncias de sociedades e associações Ad Hominem Ataques

“O assédio inclui discurso ou comportamento que não é bem-vindo ou é pessoalmente ofensivo, seja baseado em ... qualquer outro motivo não relacionado ao mérito científico” (89).

“Tentar desacreditar opiniões científicas ou indivíduos apenas com base em relações de colaboração e / ou fontes de financiamento não tem lugar no processo científico” (90).

“Em um ambiente profissional, é melhor evitar argumentos ad hominem e ataques pessoais, especialmente se eles equivalem a calúnia, difamação e / ou assédio sexual” (91).

“A crítica da linguagem, ideias ou lógica de outra pessoa é uma parte legítima da pesquisa acadêmica, mas os pesquisadores éticos evitam ataques ad hominem” (92).

“Diferenças de opinião e desacordos ... não constituem, por si só, necessariamente, os indivíduos envolvidos em assédio devem, no entanto, se esforçar para ser respeitosos e abster-se de comentários ad hominem” (93).

Respeitosamente, levante possíveis preocupações sobre erros de invalidação (ou má conduta plausível) e permita o devido processo.

Se um erro invalidante ou má conduta ocorreu, acreditamos que a melhor maneira de proceder é relatar a preocupação em particular para alguma combinação do autor, do editor do periódico ou da instituição do autor. Os cientistas devem participar do processo privado e devido de adjudicação e, se apropriado, corrigir o erro alegado rapidamente. Mesmo que posteriormente seja considerado infundado, meramente a alegação de um erro invalidante grave ou, pior ainda, má conduta, pode manchar permanentemente indivíduos ou obras importantes (94, 95). “Teste por blog” não é uma maneira de julgar o conhecimento científico ou a reputação e carreira de cientistas individuais. Não sugerimos que o discurso público sobre a ciência, e particularmente os erros potenciais ou pontos de esclarecimento, devam ser sufocados. Plataformas de discussão pós-publicação, como PubPeer, PubMed Commons e seções de comentários de periódicos, levaram a conversas úteis que aprofundam a compreensão dos leitores sobre os artigos, trazendo à tona divergências importantes no campo. As plataformas públicas informais infelizmente levaram ao ridículo público [por exemplo, uma postagem agora removida (96)], e até mesmo a batalhas legais por aqueles que foram objeto de discussão pública (97). O decoro profissional e o devido processo são requisitos mínimos para um sistema de revisão por pares funcional e, portanto, parece justo que essas normas funcionem também na revisão por pares pós-publicação. Conforme discutido nesta edição e em outros lugares (81), os erros potenciais devem ser adequadamente identificados, verificados e corrigidos, protegendo ao mesmo tempo aqueles que levantam os erros de boa fé e aqueles que estão sendo acusados ​​de cometer erros honestos. O foco deve permanecer na ciência.

Desenvolver e utilizar procedimentos uniformes para lidar com erros de invalidação alegados em tempo hábil.

Nosso apelo ao decoro profissional e ao devido processo legal é, reconhecidamente, um tanto idealista. Como relatamos em outro lugar (11), o processo de correção de erros, mesmo quando passa pelos canais adequados com os periódicos, é freqüentemente uma combinação de absurdamente lento, inepto, confuso, caro, demorado e insatisfatório. Artigos declarados pelos editores como contendo conclusões patentemente incorretas podem permanecer não retratados se um autor se recusar a retratar (98). Artigos retratados devido a erros em um periódico são republicados com os mesmos erros em outros periódicos (99). Os periódicos podem levar mais de um ano para resolver um problema, deixando de manter os indivíduos envolvidos informados sobre o progresso ou de fornecer prazos específicos. Os editores podem revogar sua responsabilidade por resolver reivindicações de erros de invalidação (100), deixando para equipes de autores fazerem casos em cartas opostas (por exemplo, refs. 101 e 102) e provavelmente deixando os leitores confusos. Parece essencial que a comunidade científica se reúna para promulgar melhores procedimentos para lidar com as preocupações sobre a invalidação de erros. O proposto Comitê Consultivo de Integridade em Pesquisa (103), combinado com o Comitê de Ética em Publicações e o Comitê Internacional de Editores de Revistas Médicas podem ser órgãos orientadores pelos quais isso pode ser realizado. Até que tais procedimentos estejam em vigor e funcionando de forma expedita, pensamos que alguns cientistas ainda podem se sentir compelidos a abordar suas preocupações publicamente, e aqueles que são acusados ​​de delitos podem buscar orientação sobre como responder às acusações (104).

Soluções potenciais.

Trazer melhorias para o empreendimento científico exigirá abordagens variadas e vigilância constante de várias partes interessadas. As soluções sugeridas freqüentemente têm sido aumentar a conscientização ou aumentar a educação. Embora admitir que temos um problema seja o primeiro passo para consertá-lo, a ciência é um esforço humano, e os cientistas comportamentais demonstraram como é difícil efetuar mudanças no comportamento e nas atitudes habituais. Assim como a própria ciência, as soluções continuarão a evoluir e exigirão o envolvimento e a coordenação de várias partes interessadas. Felizmente, ferramentas melhores estão evoluindo.

Considerações para a educação.

Abordagens educacionais são freqüentemente recomendadas como formas de corrigir problemas na ciência. Na verdade, nosso comentário de que muitos erros que vemos podem estar relacionados à ignorância parece sugerir que acreditamos que a educação é uma boa solução. Obviamente, se não aumentarmos a conscientização sobre os problemas e ensinarmos suas soluções, haverá pouca esperança de abordá-los. No entanto, existem desafios substanciais para a implementação de soluções educacionais. Acima de tudo, o rigor da pesquisa e os tópicos relacionados são partes de uma disciplina por direito próprio, portanto, simplesmente adicioná-los aos currículos é impraticável em muitas situações. Os currículos das universidades lutam para acomodar tudo o que pode ser exigido para ser ensinado, com várias subdisciplinas pressionando por mais representação em programas já inchados. Adicionar cursos adicionais sobre projeto de estudo, inferência lógica, gerenciamento de dados, análise estatística e outros tópicos que são importantes para o rigor e a reprodutibilidade podem exigir difíceis compensações curriculares ou de compromisso de tempo.

Uma abordagem para as preocupações conflitantes de tempo e educação necessária é incorporar componentes em um currículo sinérgico, onde os tópicos poderiam ser melhor integrados aos cursos existentes. Isso foi tentado, por exemplo, incorporando a escrita em cursos de laboratório, talvez incorporando lógica, análise estatística, integridade de dados ou projeto de estudo em outros cursos também poderia funcionar. Como alternativa, preparar melhor os alunos para atuar em uma equipe verdadeiramente interdisciplinar pode aliviar a necessidade de um conhecimento profundo de tudo. Se os cientistas de laboratório fossem treinados para estar familiarizados, em vez de funcionalmente proficientes, nas análises estatísticas, talvez pudessem colaborar melhor com um estatístico. Essa divergência de experiência foi recontada, mesmo que apócrifamente, em um fórum de discussão da American Statistical Association: Um neurocirurgião liga para o departamento de consultoria estatística para informá-los: "Estou fazendo um estudo e prefiro apenas fazer minhas próprias estatísticas. Então, não preciso da sua ajuda, só me pergunto se você pode sugerir um bom texto de estatísticas. ” O estatístico da consultoria diz: “Que bom que você ligou! Eu sempre quis fazer uma cirurgia no cérebro, você pode sugerir um bom texto sobre isso? " (105)

Além disso, se a educação não for acompanhada por outras mudanças estruturais, as prioridades concorrentes podem ofuscar o conhecimento adquirido. Muitos erros estatísticos já são abordados em cursos obrigatórios e, no entanto, persistem.

Considerações para funções de “porteiro”.

As funções de gatekeeper criam circunstâncias nas quais as pessoas não têm escolha a não ser "fazer a coisa certa". Tais soluções já foram implementadas em diversos domínios, como requisitos para registro de ensaios. Requisitos para depósito de dados brutos e publicação de código estatístico foram implementados por alguns periódicos. Alguns financiadores e contratos exigem a publicação de resultados, como no caso de estudos registrados em ClinicalTrials.gov. Uma coisa que essas funções têm em comum é aumentar a quantidade de informações relatadas - “maior transparência”. Afinal, é difícil identificar erros se não forem fornecidas informações suficientes para avaliar a ciência.

Essas funções de gatekeeper são importantes para forçar algumas ações. No entanto, sem a aceitação intrínseca de mudanças culturais ou incentivos extrínsecos, os pesquisadores podem cumprir apenas dentro da letra dos requisitos, ao invés do espírito de rigor pretendido. Restringir os requisitos muito pode arriscar a criação de um sistema que deixará de ser flexível o suficiente para acomodar uma variedade de áreas científicas. Além disso, alguns investigadores lamentaram que gastem, em média, quase metade do seu tempo em tarefas administrativas (106). As funções de gatekeeping podem aumentar esse fardo e têm sido criticadas como a burocratização da ciência (107). Os encargos podem ser aliviados por recursos adicionais, como novas funções de trabalho adaptadas aos requisitos das instituições, da mesma forma que uma abordagem interdisciplinar alivia a necessidade de um único cientista ser um polímata.

Considerações para sistemas de incentivos.

Os incentivos e desincentivos vão além de permitir a passagem pelas funções de porteiro. Ter permissão para publicar após cumprir as restrições do porteiro dificilmente é uma recompensa. Os incentivos envolvem recompensas, classificações e classificações que fornecem reconhecimento pelo trabalho bem executado. Receber distintivos para práticas de ciência aberta (por exemplo, por meio da Badge Alliance) é uma abordagem para a motivação extrínseca por meio do reconhecimento. Essas recompensas podem precisar de reforço adicional além do reconhecimento passivo da comunidade, como inclusão nas decisões de posse e promoção.

Sistemas desincentivos também podem ser empregados. Por exemplo, o National Institutes of Health pode reter o financiamento se os estudos associados ao seu financiamento não estiverem em conformidade com o acesso público - isso também pode ser considerado uma função de guardião, no entanto, os investigadores sendo multados por não submeterem os resultados ao ClinicalTrials.gov podem ser considerados um desincentivo.

Incentivos e desincentivos podem resultar em "enganar o sistema". Esses incentivos recentemente questionados, como o reconhecimento pela publicação em periódicos de alto fator de impacto, resultaram em periódicos que aumentaram artificialmente seu fator de impacto por meio de vários meios de aumentar as autocitações (108). Em qualquer grande empresa, o comportamento pode, na melhor das hipóteses, ser melhorado de forma incremental. Os processos precisam ser resilientes à manipulação e não devem substituir a avaliação crítica dos resultados da pesquisa.

Considerações para aumentar os recursos.

A necessidade de aumentar os recursos para melhorar o rigor e a reprodutibilidade também é um refrão comum. Se as soluções de educação, porteiro e incentivo devem ser realizadas, eles precisarão de financiamento, pessoal e adesão adequados das partes interessadas. No entanto, aumentar os recursos para o rigor significa que os recursos podem ser retirados de outros empreendimentos, a menos que a sociedade aumente os recursos in toto (como por meio de impostos) ou soluções criativas sejam implementadas.

A redistribuição de recursos para reforçar a pesquisa rigorosa pode se pagar. Em vez de muitos estudos pequenos, insuficientes e não randomizados, ou coleta de dados de pesquisa transversal com uma variedade de questionários discordantes e não validados, poderíamos reunir recursos para consórcios para fornecer um conhecimento mais útil, completo e confiável, especialmente para teste probatório, de hipóteses pesquisar. Isso não significa subestimar o trabalho exploratório, mas com muita frequência, o trabalho exploratório ou os estudos-piloto e de viabilidade são apresentados como testes de hipóteses, em vez de gerar pesquisas. Essa mudança de cultura poderia aliviar a carga fiscal de reforçar o rigor e melhorar os ganhos em conhecimento com o enriquecimento de nosso corpus de pesquisa com evidências de alta qualidade.

Com o tempo, muitas soluções propostas devem ganhar eficiência.De fato, várias diretrizes de relatórios de melhores práticas (por exemplo, as diretrizes de Padrões Consolidados de Ensaios de Relatórios para testes em humanos ou as diretrizes de Pesquisa Animal: Relatórios de Experimentos In Vivo para estudos em animais) foram simplificadas para uso por periódicos, exigindo menos esforço de implementação.

Considerações para mudanças na cultura científica.

Aumentar a motivação intrínseca para conduzir ciência rigorosa é a pedra angular de nossas considerações propostas. As outras considerações que apresentamos dependem de os indivíduos terem a motivação intrínseca para buscar a verdade e ver a ciência como sua vocação ou paixão, em vez de apenas "um trabalho". Sem uma dedicação para encontrar os próprios erros, os cientistas podem não buscar educação, podem contornar as funções de gatekeeper, podem jogar incentivos ou podem desperdiçar recursos em favor de outras prioridades.

A normalização da correção de erros é necessária para o avanço da empresa. Alguns sugeriram retirar ou substituir a palavra abrangente “retratação” (que evoca “má conduta”) por descrições mais significativas de correção (109). “Retratação e republicação” poderiam ser usadas tanto para manter o registro histórico quanto para corrigir a literatura científica (110). Se a ciência deve ser autocorretiva, encorajar os autores a serem participantes ativos no processo de correção é essencial, e o estigma deve ser minimizado em casos de erros honestos.

Da mesma forma, reconhecer os cientistas por sua contribuição ao processo de controle de qualidade científica da revisão por pares pode ser uma mudança cultural importante. Os periódicos há muito listam os nomes dos revisores em declarações anuais de agradecimento, mas a revisão por pares às vezes é vista como um fardo - uma expectativa de serviço adicional sem remuneração - e pode ser relegada a uma nota de rodapé em alguns currículos. Um movimento no sentido de valorizar a revisão por pares levou à criação da Publons.

Se pudermos reforçar que a qualidade científica deve ser buscada acima de tudo em um empreendimento científico - ao invés de contracheques ou publicações, concessões ou grandeza - então acreditamos que melhorias virão em seguida.


2 respostas 2

Para alguns arquivos, uma verificação da proporção de bytes no intervalo ASCII imprimível ajudará. Se mais de 75% dos bytes estiverem nesse intervalo dentro das primeiras centenas de bytes, então provavelmente é 'legível'.

Alguns arquivos têm cabeçalhos, como as várias formas de BoM em arquivos UTF, o 0xA5EC que inicia os arquivos MS doc ou a assinatura "MZ" no início do .exe, que informará se o arquivo é legível ou não.

Muitos arquivos de texto modernos estão em um dos formatos UTF, que geralmente podem ser identificados lendo a primeira parte do arquivo, mesmo que não tenham um BoM.

Basicamente, você terá que percorrer vários tipos de arquivos diferentes para ver se há uma correspondência. Carregue o primeiro kilobyte do arquivo na memória e execute várias verificações diferentes nele. Depois de ter alguns dados, você pode solicitar as verificações para procurar os formatos mais comuns primeiro.

Em geral, você não pode fazer isso. Você pode usar um algoritmo de identificação de idioma para adivinhar se um determinado texto é um texto que poderia ser falado por humanos. Já que seu exemplo contém linguagens formais como html, entretanto, você está com sérios problemas. Se você realmente deseja implementar sua verificação para (um conjunto finito de) linguagens formais, pode usar um analisador GLR para analisar a gramática (ambígua) que combina todas essas linguagens. Isso, entretanto, ainda não resolveria o problema dos erros de sintaxe (embora seja possível definir uma heurística). Finalmente, você precisa considerar o que você realmente quer dizer com "legível por humanos": por exemplo, você inclui Base64?

editar: Caso você esteja interessado apenas no conjunto de caracteres: Veja a resposta a estas perguntas. Basicamente, você deve ler o arquivo e verificar se o conteúdo é válido em qualquer codificação de caractere que você considera legível por humanos (utf-8 deve abranger a maioria dos casos do mundo real).

F ώΚ σMΜΛLK-.Ρ K- * ΞΜΟ & # 179R0Τ3ΰεβε PK & # 178ξ & quot e, embora sejam caracteres gregos válidos, não serão D: & quot: - (& ndash fill & # x361pant & # x361 22 de junho de 2015 às 10:42


Problemas de acessibilidade com captchas de áudio

Os desafios de áudio têm sido a solução de fato para permitir a acessibilidade em conjunto com captchas visuais. Apesar de suas limitações de ser difícil para falantes não nativos, usuários de idades mais jovens, usuários com dificuldades de aprendizagem ou linguagem, nenhuma outra alternativa foi amplamente implementada.

Uma pesquisa de Chellapilla et al. argumenta que as Provas de Interação Amigáveis ​​aos Humanos (HIPs) devem se aproximar de uma taxa de sucesso de pelo menos 90%. Mas um estudo de usabilidade com seis participantes cegos no ReCAPTCHA do Google descobriu que eles conseguiram resolver apenas 46% dos desafios de áudio em uma média de 65 segundos. Um estudo de Bigham et al. com alunos cegos do ensino médio descobriram que nenhum deles foi capaz de resolver os captchas de áudio. Em um estudo subsequente com 89 usuários cegos, eles descobriram que os usuários alcançaram uma taxa de sucesso de apenas 43% na resolução de 10 CAPTCHAs de áudio populares.

No mesmo estudo de Bigham et al, também foi verificado que leitores de tela usados ​​por usuários cegos falam enquanto reproduzem CAPTCHAs de áudio. Conforme os usuários navegam até a caixa de resposta, o software de acessibilidade continua lendo a interface enquanto fala sobre o desafio de reprodução de áudio. Um desafio de áudio em reprodução não pausa para os usuários enquanto eles digitam sua resposta. Rever um CAPTCHA de áudio é complicado, muitas vezes exigindo que o usuário comece novamente do início. Além disso, reproduzir um CAPTCHA de áudio exige que os usuários naveguem para fora da caixa de resposta para acessar os controles do reprodutor de áudio.


Materiais e métodos

Participantes.

Participaram deste estudo 18 indivíduos destros [média de 11 mulheres (M) = 22,2 anos] com visão normal ou corrigida para normal. A destreza forte foi verificada com uma forma modificada do Annett Handedness Questionnaire (Annett, 1970). Todos os participantes eram falantes nativos de inglês e não haviam aprendido nenhum outro idioma antes dos cinco anos. Nenhum participante indicou qualquer deficiência de aprendizagem ou qualquer histórico de distúrbios neurológicos ou psiquiátricos. Os participantes foram recrutados em universidades locais, por meio do Centro de Neurociência Cognitiva da Universidade da Pensilvânia. De acordo com o Comitê de Revisão Institucional da Universidade da Pensilvânia, todos os participantes forneceram consentimento informado e foram remunerados monetariamente pela participação.

Medida do estilo cognitivo verbal e visual autorreferido.

Uma versão computadorizada do Verbalizer-Visualizer Questionnaire revisado (Kirby et al., 1988) foi administrada para avaliar o grau em que os participantes empregam o raciocínio visual e verbal em tarefas e situações comuns. O VVQ (seguindo modificações desenvolvidas por Kirby et al., 1988) consiste em 10 afirmações relacionadas a um estilo de raciocínio verbal e 10 relacionadas a um estilo de raciocínio visual (10 questões adicionais avaliam uma terceira dimensão de "vivacidade dos sonhos" que não foi incluída em análise posterior). Os participantes classificaram cada afirmação em uma escala discreta de cinco pontos de concordo totalmente (5) a discordo totalmente (1). As pontuações para as afirmações visuais e verbais foram calculadas separadamente, onde somamos as respostas de todas as 10 questões dentro daquela dimensão. As cinco perguntas formuladas positivamente receberam pontuações positivas, enquanto as cinco perguntas formuladas negativamente receberam pontuações negativas, criando assim uma gama de pontuações possíveis de -20 a 20. O questionário foi apresentado em um computador usando o software E-Prime (Ferramentas de Software de Psicologia) , com o texto aparecendo em preto sobre um fundo branco.

Testes objetivos de habilidades cognitivas visuais e verbais.

Subtestes da Escala de Inteligência de Adultos de Wechsler (WAIS), Terceira Edição (Wechsler, 1997), foram usados ​​para avaliar a habilidade de raciocínio visual e verbal. Administramos seis subtestes consecutivamente: preenchimento de imagem, vocabulário, semelhanças, desenho de blocos, raciocínio de matriz e informações. As pontuações do Índice de Compreensão Verbal (VCI) foram calculadas a partir do desempenho no vocabulário, semelhanças e informações. As pontuações do Perceptual Organization Index (POI) foram calculadas a partir do desempenho na conclusão da imagem, desenho do bloco e raciocínio da matriz.

Tarefa de julgamento de similaridade.

Os participantes completaram uma tarefa de julgamento de similaridade durante a fMRI. Conforme mostrado na Figura 1, cada item nesta tarefa consistia em uma imagem (por exemplo, um triângulo vermelho com listras) ou um conjunto de três palavras que nomeavam uma forma, cor e padrão (por exemplo, vermelho, listras, triângulo). Havia cinco atribuições de atributos possíveis para cada uma das três características que compunham cada item.

Em cada ensaio experimental, os participantes primeiro viram um item-alvo (imagem ou palavras) no centro da tela por 1500 ms. Posteriormente, dois itens de sondagem (duas imagens ou dois conjuntos de palavras) apareceram por 3.500 ms antes de desaparecerem. Como os alvos e sondas podiam ser apresentados como imagens ou palavras, havia quatro condições de teste dentro do sujeito: imagem-imagem, palavra-palavra, imagem-palavra e palavra-imagem. Os participantes completaram 30 tentativas de cada uma dessas quatro condições. Nenhum conjunto de três itens (alvo e duas sondas) jamais foi repetido dentro ou entre os tipos de condição.

Quando os itens da sonda apareceram, os participantes indicaram por meio do pressionamento do botão qual das duas sondas era mais semelhante ao alvo anterior. Os participantes tiveram 3.500 ms para responder antes que as sondas desaparecessem. As sondas foram então imediatamente substituídas por uma cruz de fixação central por 1 s. Em metade das tentativas experimentais, a resposta correta foi a ponta de prova esquerda, e na outra metade das tentativas experimentais, a resposta correta foi a ponta de prova direita. As pontas de prova corretas continham dois dos três recursos em comum com os itens incorretos de destino continham apenas um recurso em comum. Esta regra não foi declarada explicitamente aos participantes, em vez disso, o feedback foi dado em várias tentativas práticas e todos os participantes demonstraram proficiência na tarefa antes do início da primeira execução. Os dados do piloto indicaram que os estímulos representados como imagens tinham alta concordância de nomes com os rótulos verbais associados.

Coleção de dados.

A participação envolveu duas sessões experimentais. Não se passaram mais de 2 semanas entre as duas sessões. Na primeira sessão, os participantes forneceram consentimento informado e, em seguida, completaram os subtestes WAIS, seguidos de um Questionário de Vivacidade de Imagens Visuais (Marks, 1973) e, finalmente, o VVQ. A administração desta sessão durou ∼1 h.

Na segunda sessão, os participantes completaram a tarefa de julgamento de similaridade durante a varredura de fMRI. Após a conclusão das tentativas práticas e uma varredura anatômica, o participante concluiu a tarefa experimental. No total, esta sessão durou ∼40 min. Por causa da falha do equipamento, os dados não foram coletados durante a varredura funcional para uma execução de um dos participantes. Para todos os outros participantes, três execuções funcionais completas foram coletadas. Consulte o material suplementar, disponível em www.jneurosci.org, para obter mais detalhes sobre a coleta e análise de dados de fMRI.

Um projeto estocástico relacionado a eventos foi implementado em que todas as quatro condições experimentais (imagem-imagem, palavra-palavra, imagem-palavra, palavra-imagem), bem como períodos de fixação de 6 segundos instáveis, foram misturados de forma pseudo-aleatória em três execuções de 8 min cada. Dez tentativas de cada uma das condições experimentais apareceram em cada corrida, e vinte tentativas de fixação de 6 s também foram incluídas em cada corrida.

Cada um dos 60 ensaios de fixação durou 6 se foram, de resto, idênticos à fixação de 1 s que apareceu no final de cada ensaio experimental. Durante a análise, os testes de fixação de 6 s foram divididos em duas condições, metade dos testes de fixação foram usados ​​como linha de base (não modelados) e a outra metade foi usada como condição de controle. Isso foi feito para que pudéssemos avaliar a atividade cerebral durante um conjunto de períodos de fixação, conforme rastreado com nossas variáveis ​​preditoras paramétricas (pontuações VVQ). Como os testes de fixação de 6 s foram misturados pseudo-aleatoriamente entre outros testes (e às vezes apareceram em sucessão), fomos capazes de limitar a quantidade de covariância entre os testes de fixação usados ​​para a linha de base, os testes de fixação usados ​​para a análise paramétrica e os testes experimentais (Friston et al., 1999).

Duas outras tarefas também foram realizadas nas mesmas execuções e foram originalmente concebidas como possíveis condições de controle adicionais. Isso consistia em duas tarefas nas quais os participantes simplesmente pressionavam um botão no início do estímulo visual. Um tipo de estímulo era um agrupamento abstrato de manchas de cores, usando as mesmas cores da condição da imagem. O outro tipo de estímulo consistia em pseudopalavras pronunciáveis, que os sujeitos também eram instruídos a ler para si mesmos durante a visualização. Essas tarefas não são discutidas mais adiante, pois eram desnecessárias para as análises presentes.

Antes da primeira execução, oito tentativas experimentais, compostas por duas tentativas de cada uma das quatro condições experimentais, foram fornecidas ao participante com feedback para garantir que cada participante entendeu as instruções da tarefa. Nenhum feedback foi dado durante a sessão de digitalização.


Por que a instrução de compreensão por meio da tomada de perspectiva é importante?

Compreender a literatura e entender as pessoas extraem de muitas das mesmas habilidades, particularmente devido à tomada de perspectiva, mais precisamente denominada como teoria da mente (Pelletier & amp Astington, 2004). Consequentemente, os leitores usam experiências da vida real para entender os personagens da história e usam o insight do mundo imaginado dos personagens da história para navegar melhor em seu mundo real. Por exemplo, os adultos que lêem ficção com frequência mostram uma empatia mais forte do que os leitores de não ficção (Mar, Oatley & amp Peterson, 2009). Ainda mais surpreendente, as intervenções que exigem que os adultos leiam a literatura podem melhorar as habilidades de empatia (Djikic, Oatley, & amp Moldoveanu, 2013). Em suma, o estereótipo do leitor ávido anti-social está sendo desmascarado (Mar, Oatley, Hirsh, dela Paz, & amp Peterson, 2006).

Infelizmente, pesquisas limitadas exploraram como a literatura pode ajudar a desenvolver infantil habilidades sociais, embora Lobron e Selman (2007) defendam que a coordenação de perspectiva ensinada por meio da literatura fornece uma base para a consciência social. Essa ideia compartilha características com a biblioterapia (por exemplo, Pehrsson, 2005), quando as histórias são usadas para ajudar as crianças a lidar com eventos traumáticos, como a perda de um dos pais. Biblioterapia geralmente aborda uma crise, no entanto. Em contraste, defendemos que a ficção também pode ser usada proativamente como um campo de treinamento para praticar a tomada de perspectiva e a análise de conflitos. Idealmente, os alunos podem usar o insight da ficção para desenvolver habilidades interpessoais que lhes permitem resolver, em vez de intensificar, os conflitos.

Habilidades de tomada de perspectiva também apoiam diretamente o desenvolvimento da alfabetização, particularmente compreensão e motivação de ordem superior. Assim, o Estágio Quatro de Chall (1983) de desenvolvimento da alfabetização é leitura para múltiplos pontos de vista na literatura e em textos informativos. A compreensão inferencial exige claramente o uso de conhecimento além do texto para compreender as ações e motivos dos personagens. Além disso, a alfabetização crítica exige que os leitores considerem questões como “Que visão de mundo é apresentada pelas ideias neste texto? Quais visualizações não são? ” (Cervetti, Pardales & amp Damico, 2001). Essas questões desafiadoras exigem que os leitores considerem os objetivos dos outros, especialmente os do autor. Uma meta-análise recente mostra que mesmo simplesmente instruir os leitores a adotar perspectivas alternativas enquanto lêem as narrativas pode melhorar a compreensão (Yeh & amp McTigue, 2013).

Finalmente, como o engajamento para a leitura é um estado emocional, a instrução da leitura deve considerar tanto as habilidades cognitivas quanto as emoções para construir a motivação (Guthrie & amp Wigfield, 2000). Portanto, se pudermos ajudar os alunos a se conectar com os personagens por meio da adoção de perspectiva e empatia, isso fornecerá motivação para persistir. Simplificando, os alunos vão querer saber o que acontece no final!


Como os humanos são capazes de ler texto / caracteres embaralhados (por exemplo, CAPTCHA)? - psicologia

Segundo um pesquisador (sic) da Universidade de Cambridge, não importa a ordem das letras em uma palavra, o importante é que a primeira e a última letra estejam no lugar certo. O resto pode ser uma bagunça total e você ainda pode lê-lo sem problemas. Isso ocorre porque a mente humana não lê todas as letras por si mesma, mas a palavra como um todo.

Este texto circulou na internet em setembro de 2003. Tomei conhecimento dele pela primeira vez quando um jornalista contatou meu colega Sian Miller em 16 de setembro, tentando rastrear a fonte original. Ela foi transmitida muitas vezes e, como a maioria dos memes da Internet, sofreu mutações ao longo do caminho. Pareceu-me interessante - especialmente quando recebi uma versão que mencionava a Universidade de Cambridge! Trabalho na Cognition and Brain Sciences Unit, em Cambridge, no Reino Unido, uma unidade do Medical Research Council que inclui um grande grupo que investiga como o cérebro processa a linguagem. Se há uma nova pesquisa sobre leitura que está sendo conduzida em Cambridge, achei que deveria ter ouvido falar dela antes.

Escrevi esta página para tentar explicar a ciência por trás desse meme. Há elementos de verdade nisso, mas também algumas coisas que os cientistas que estudam a psicologia da linguagem (psicolinguistas) sabem que são incorretas. Vou quebrar o meme, uma linha por vez, para ilustrar esses pontos, apontando o que considero ser a pesquisa relevante sobre o papel da ordem das letras na leitura. Novamente, esta é apenas minha visão do estado atual da pesquisa de leitura, no que se refere a este meme. Se você acha que perdi algo importante, me avise [matt.davis & # 64 mrc-cbu.cam.ac.uk].

Outras línguas:

Meus colegas e eu também conhecemos as versões em espanhol e francês que anexei abaixo. Existem, sem dúvida, versões em muitos outros idiomas também. Se você souber de outros, me informe [matt.davis & # 64 mrc-cbu.cam.ac.uk] e eu os adicionarei à lista. Eu estaria especialmente interessado em versões deste texto em idiomas que (pelo menos que eu saiba) funcionam de maneira muito diferente do inglês em sua forma escrita. Por exemplo:

1) línguas semíticas (como hebraico ou árabe), onde as vogais tendem a não ser escritas no texto

2) línguas aglutanativas (como finlandês ou turco), onde as palavras são dramaticamente mais longas do que em inglês

3) idiomas como o tailandês, que (convencionalmente) não colocam espaços entre as palavras

4) linguagens logográficas, como o chinês, em que símbolos complexos representam uma palavra ou conceito completo.

Atualização (7/10/03):

Parece que pelo menos uma das minhas previsões está correta. Graças a Peter Eskolin e Ari Ruottu, tive algumas sugestões para versões em finlandês do texto. Peter e Ari sugerem que o texto embaralhado resultante é muito difícil de ler.Seus nomes estão vinculados às sugestões de versões embaralhadas do texto.

Uma possibilidade interessante (graças a Rémy Viredaz e outros que mencionaram isso) é que uma coisa que torna esses embaralhamentos difíceis de ler é que as letras embaralhadas frequentemente se movem além dos limites dos morfemas. Uma maneira de tornar as palavras polimorfêmicas mais fáceis de ler quando embaralhadas seria manter as letras em uma posição próxima à sua localização original. Isso é aparente em algumas das versões alemãs do texto.

Também recebi uma versão hebraica do texto, que aparentemente não pôde ser lida quando embaralhada. No entanto, não consegui ler os personagens, desculpe! Se algum de vocês puder ajudar na conversão de texto hebraico em arquivos gráficos, me avise.

Graças a Samuel Wazana e John Sutton, agora tenho uma versão em hebraico do texto original e embaralhado. Samuel sugere que o texto embaralhado é "uma bagunça REAL .. você não consegue entender de jeito nenhum". Isso pode refletir uma propriedade interessante do sistema de escrita hebraico. Como as vogais não são escritas no texto, há muito menos redundância no hebraico escrito. Pode ser que os leitores já estejam usando alguns processos de inferência para descobrir o que são as palavras escrita, a carga extra adicionada por letras embaralhadas cria um nível de dificuldade adicional excessivo. Também é possível que palavras escritas sejam mais confundíveis em hebraico - ou seja, muitas outras palavras são como "sal" e "ripa", em que as transposições de letras criam outras palavras.

Obrigado a todos os vários leitores que se ofereceram para ajudar a colocar um texto em hebraico online.

Sgeun un etsduio de una uivenrsdiad ignlsea, no ipmotra el odren en el que las ltears etsan ersciats, la uicna csoa ipormtnate es que la pmrirea y la utlima ltera esten ecsritas en la psiocion cocrrtea. El rsteo peuden estar ttaolmntee mal y aun pordas lerelo sin pobrleams. Etso es pquore no lemeos cada ltera por si msima preo la paalbra es un tdoo.

Sleon une édtue de l'Uvinertisé de Cmabrigde, l'odrre des ltteers dnas un mtos n'a pas d'ipmrotncae, la suele coshe ipmrotnate é que la pmeirère et la drenèire soit à la bnnoe pclae. Le rsete peut êrte dnas un dsérorde ttoal et vuos puoevz tujoruos lrie snas porlblème. C'est prace que le creaveu hmauin ne lit pas chuaqe ltetre elle-mmêe, mias le mot cmome un tuot.

(note que as letras estão misturadas e que os acentos mudaram com as letras associadas).

Vlgones een oznrdeeok op een Eglnese uvinretsiet mkaat het neit uit in wlkee vloogdre de ltteers em een ​​wrood saatn, het einge wat blegnaijrk is is dat de eretse en de ltaatse ltteer op de jiutse patals saatn. De rset van de ltteers mgoen wllikueirg gpletaast wdoren en je knut vrelvogens gwoeon lzeen wat er saatt. Dit kmot odmat we neit ekle ltteer op zcih lzeen maar het wrood als gheeel.

Obrigado a Sander Jonkers por passar isso adiante, e ao pessoal da Onzetaal por criar um link para este site.

En viskdenbaleig unsdelrøgelse lavet af et untivseriet i Enlgnad har vist, at desrom de to føsrte og de to sisdte botsvgaer i all oredene i en tekst er ritgigt pledsaret, spllier det inge rolle knevirkel ræføkilen rægøkilen ræføkilen ou bosque knevirge. Tektsen er fuldt læbsar selv om de adre bogastver kommer huilbtertlulter! Det er, fordi vi ikke læser hvert eneklt botgsav, men ser bildeler af ordet som en hehled.

Agradeço a Randi Starrfelt por enviar isso para mim.

Você notará que algumas dessas traduções afirmam que a pesquisa vem de uma "English University" (o que está correto), ao invés de "Cambridge University".

Die Bcuhstbaenrehenifloge em eneim Wrot ist eagl

Ncah enier nueen Sutide, die uetnr aerdnem von der Cmabirdge Uinertvisy dührruchgeft wrdoen sien slol, ist es eagl, in wlehcer Rehenifloge Bcuhstbaen em eneim Wrot sethen, Huaptschae, der esrte und ltzetehcien der ltzetehcien. Die rsetclhien Bshcuteban kenönn ttoal druchenianedr sien, und man knan es tortzedm onhe Poreblme lseen, wiel das mneschilhce Gherin nhcit jdeen Bcuhstbaen enizlen leist, snodren das Wrot als gnazes. Mti dme Pähonemn bchesfätgein shci mherere Hhcochsluen, acuh die aerichmkianse Uivnäseritt em Ptstbigurh. Esrtmlas üebr das Tmeha gchseibren hat aebr breteis 1976 - und nun in der rgchitien Bruecihhsetnafoelngbe - Graham Rawlinson in sieenr Dsiestraiton mit dem Tetil "A Significância da Posição da Letra no Reconhecimento de Palavras" an der egnlsmice.

Obrigado a Hermann Schwarting por me enviar isso por e-mail. Isso apareceu no Frankfurter Allgemeine Zeitung em 24.09.03. Você notará que isso é bastante estendido e inclui uma referência correta à tese de Graham Rawlinson.

Há também a seguinte tradução - que é muito mais próxima do original em inglês (de Robert Fuchs):

Luat eienr Stduie der Cambrdige Unievrstiät speilt es kenie Rlloe in welcehr Reiehnfogle die Buhcstbaen in eniem Wrot vorkmomen, die eingzie whctige Sahce ist, dsas der ertse und der lettze Buhcstbaen stmimt. Der Rset knan In eienm völilegen Duchrienanedr sein und knan trtozedm prboelmols gelseen wreden. Gunrd ist, dsas das menchsilche Ague nicht jeedn Buhcstbaen liset.

E um cartoon sobre o assunto de Der Spiegel (de Raymond Noë).

Obrigado a Vaclav Janca por passar isso adiante. Você também pode baixar o texto checo.

Svmkmaæt rnsanókn við Cmabrigde hkóásla þá stkpiir ekki mlái í hðvaa röð stfiar í oðri eru, það enia sem stikipr mlái er að frtsyi og stíasði stinaurfn séu á rtéutm satð. Aillr hniir sfitarnir gtea vireð í aöljrgu rlgui en þú gtuer smat lseið það aðvuledlgea. Áæðsatn fiyrr þsesu er að mnnashgrniuun les ekki hevrn satf friyr sig hleudr oirðð sem hiled.

Obrigado a Suzanne Buerger por encaminhar isso.

Português (brasileiro):

De aorcdo com uma pesqiusa de uma uinrvesriddae ignlsea, não ipomtra em qaul odrem as lrteas de uma plravaa etãso, a úncia csioa iprotmatne é que a piremria e útmlia lrteas etejasm no lgaur crteo. O rseto pdoe ser uma ttaol bçguana que vcoê pdoe anida ler sem pobrlmea. Itso é poqrue nós não lmeos cdaa lrtea isladoa, mas a plravaa cmoo um tdoo.

Agradeço ao Zé do Rock por me enviar isso.

En vestenkalpig unsdernöking gjord vid ett untivseriet i Enlgand har visat att utfiall de två fösrta och de två sista botskevärna i alla orden i en text är ritkigt plessarade, spelar det liten roll i vikmerjord de vikmerjindslöfdena ​​i boskevärna. Tetxen är fullt läbsar t.o.m. om de andra bokestävrna kommer hullorebmuller! Detta eftorsem vi inte läser varje enkisld botksav, utan ser bidlen av ordet som helhet.

Obrigado a Hakan Kjellerstrand por passar isso adiante. Aparentemente, isso foi postado pela primeira vez no dia 1º de setembro, aqui. Como a versão dinamarquesa, esta na verdade tem as duas primeiras e últimas letras fixas - que é mais semelhante à tese de doutorado de Graham Rawlinson e à carta que ele escreveu para a New Scientist. Não me surpreenderia se essa mudança de duas para uma letra externa sendo corrigida fosse uma mudança relativamente tardia para o meme.

Bahasa Indonésia:

Menuurt sbeauh penilitean di Cmabrigde Uinervtisy, tdaik mejnadi maslaah bgaimanaa urtaun hufur-hufur di dlaam sebauh kaat, ynag palngi pnteing adlaah leatk hruuf partema dan terkhair itu bnaer. Siasnya dpaat brantaaken saam skelai dan kmau maish dpaat mebmacanya tnpaa msaalah. Hal ini kerana aveia masunia tdaik mambeca seitap huurf msaing-msaing, tatepi kaat kesuleruhan.

Agradeço a Frederik Rotty por me enviar isso por e-mail.

Agradeço a Anastassia Kerr por passar isso para mim. Se desejar, você também pode baixar o texto em russo como um arquivo MS-Word.

Saips NJE siumtdi të Bere nga NJE utsveneiirt algenz, Per lxmeiin e fajlëve nuk ka rëndësi rjtnidea e srjahknove.Maotfjn qe skojnrha e Paré dhe e fnduit të Jene në vndeet e trye.Të tejrat mnud të Jene në NJE çregrullim të Polte dhe ne mnud të loxejmë pa polebrm.Kjo spese turri ynë nuk i loxen srojahknt një nga një, por fajlët si të polta.

Obrigado a Ymer Mulakaj por enviar isso.

Agradeço a Tamas Szepes por encaminhar isso para mim. Você também pode baixar a versão em húngaro como um arquivo rich text.

Da uno stdiuo dlela Camrbidge Urnievristy, l'oridne dllee letetre em una paorla non ha ipmotranza, la sloa csoa impoanrtte é che la pimra e l'ulmtia sinao nllea pozisione corttreta. Tttue le alrte letetre pososno esesre totamletne diosrdiante e tu sarai sepmre in grdao di legegre sezna prolbemi. Quetso é dovtuo al ftato che il cevrello umnao non lgege ongi letetra ma la paorla glolabmnete.

Obrigado a Alberto Castelnuovo por enviar este e-mail.

Irlandês (gaélico):

De riér tdgaihe ag Osllocil Cmabrigde é cmua cen tord atá ar na lriteahca i bhfacol má bhoínn an chaéd ltiir augs an liitr dhreineaach san áit chaert, augs an chiud elie em bpairseach. Is fiédir an taécs a thiucsint gan dua, ós rud é go lénan an itninn gcah fcoal ina imoliáne, ní liitr i ndaiidh litearch. Inotach.

Obrigado a Hanna Burdon por passar isso adiante. Você também pode baixar o texto em polonês no formato MS-Word.

aoccdrnig para um rscheearch em Cmabrigde Uinervtisy. De acordo com uma pesquisa (sic) na Universidade de Cambridge

Existem vários grupos em Cambridge, Reino Unido, fazendo pesquisas sobre idiomas. Tem o grupo onde trabalho (Unidade de Cognição e Ciências do Cérebro), também existem grupos do Departamento de Psicologia Experimental com destaque para o Centro de Fonoaudiologia (onde trabalhava). Há também pesquisadores de línguas em Fonética, Inglês e Linguística Aplicada, e na Anglia Polytechnic University.

Que eu saiba, não há ninguém em Cambridge, Reino Unido, que atualmente esteja fazendo pesquisas sobre esse tópico. Pode haver pessoas em Cambridge, MA, EUA que são responsáveis ​​por esta pesquisa, mas eu não as conheço. Se você souber de algo diferente, me avise [matt.davis & # 64 mrc-cbu.cam.ac.uk].

Encontrei uma página www que rastreou a demonstração original do efeito da randomização de cartas para Graham Rawlinson. Graham escreveu uma carta para a New Scientist em 1999 (em resposta a um artigo de Saberi & amp Perrot (Nature, 1999) sobre o efeito de reverter trechos curtos da fala). Você pode ler a carta aqui ou no link da New Scientist aqui. Nele Graham diz:

Isso me lembra meu PhD na Nottingham University (1976), que mostrou que a randomização de letras no meio de palavras teve pouco ou nenhum efeito na habilidade de leitores habilidosos de entender o texto. Na verdade, um leitor rápido notou apenas quatro ou cinco erros em uma página A4 de texto confuso.

É possível que, com a publicidade oferecida pela internet, a pesquisa do Dr. Rawlinson seja mais amplamente lida no futuro. Para aqueles que desejam citar isso em suas próprias pesquisas, a referência completa é:

Rawlinson, G. E. (1976) O significado da posição da letra no reconhecimento de palavras. Tese de PhD não publicada, Departamento de Psicologia, University of Nottingham, Nottingham UK.

Graham gentilmente me enviou um resumo de seu trabalho de tese.

não importa o que os alunos em um wrod estão, o velho iprmoetnt tihng é que o primeiro e o ltteer estejam na página direita. não importa a ordem das letras em uma palavra, a única coisa importante é que a primeira e a última letra estejam no lugar certo

Isso está claramente errado. Por exemplo, compare as seguintes três sentenças:

Todas as três sentenças foram randomizadas de acordo com as "regras" descritas no meme. A primeira e a última letras permaneceram no mesmo lugar e todas as outras letras foram movidas. Porém, suspeito que sua experiência seja igual à minha, de que os textos vão ficando cada vez mais difíceis de ler. Se você ficar preso, as frases serão vinculadas aos textos originais não embaralhados.

Esperançosamente, essas demonstrações o convenceram de que, em alguns casos, pode ser muito difícil entender frases com palavras confusas. Obviamente, a primeira e a última letra não são as únicas coisas que você usa ao ler o texto. Se esse fosse realmente o caso, como você diria a diferença entre pares de palavras como "sal" e "ripa"?

Vou listar algumas das maneiras pelas quais acho que o (s) autor (es) deste meme podem ter manipulado o texto confuso para torná-lo relativamente fácil de ler. Isso também servirá para listar os fatores que pensamos podem ser importantes para determinar a facilidade ou dificuldade de leitura de um texto confuso em geral.

Ainda há um debate muito real na psicologia da leitura, no entanto, sobre exatamente quais informações usamos durante a leitura. Não sei quanto dessa literatura o Dr. Rawlinson estava ciente na época de sua tese, mas acho que o texto confuso fornece uma ilustração clara de algumas das fontes de informação que agora consideramos importantes. Vou revisar algumas das pesquisas feitas para demonstrar isso.

o rset pode ser uma mensagem toatl e você pode sentar-se nele usando seu porbelm. o resto pode ser uma bagunça total e você ainda pode lê-lo sem problemas

Esta frase é, como o resto da demonstração, surpreendentemente fácil de ler, apesar de ser confusa. Como você viu acima, nem todas as frases distorcidas da mesma maneira são tão fáceis de ler. O que torna esta frase tão fácil? Meus colegas e eu sugerimos as seguintes propriedades:

1) Palavras curtas são fáceis - palavras de 2 ou 3 letras não mudam em nada. A única mudança que é possível em palavras de 4 letras é trocar a ordem das letras do meio, o que não causa muita dificuldade (ver 4).

2) Palavras funcionais (o, ser e, você etc.) permanecem iguais - principalmente porque são palavras curtas, consulte (1). Isso realmente ajuda o leitor, preservando a estrutura gramatical do original, ajudando você a descobrir qual palavra provavelmente virá a seguir. Isso é especialmente importante para a leitura de texto confuso - palavras previsíveis serão mais fáceis de ler nessa situação.

3) Das 15 palavras desta frase, 8 ainda estão na ordem correta. No entanto, como leitor, você pode não perceber isso, pois muitas das palavras que permanecem intactas são palavras funcionais, que os leitores tendem a não notar durante a leitura. Por exemplo, quando as pessoas são solicitadas a detectar letras individuais em uma frase, é mais provável que elas percam letras em palavras funcionais.

Healy, A. F. (1976). Detecção de erros na palavra o: Evidência para unidades de leitura maiores do que letras. Journal of Experimental Psychology: Human Perception & amp Performance, 2, 235-242.

4) Transposições de letras adjacentes (por exemplo. Porbelm para problema) são mais fáceis de ler do que transposições mais distantes (por exemplo Pborlem) Sabemos, por pesquisas em que as pessoas lêem palavras apresentadas muito brevemente na tela de um computador, que as letras externas das palavras são mais fáceis de detectar do que as do meio - confirmando uma das ideias presentes no meme. Também sabemos que as informações sobre a posição das letras no meio das palavras são mais difíceis de detectar e que os erros cometidos tendem a ser transposições.

McCusker, L. X., Gough, P. B., Bias, R. G. (1981) Reconhecimento de palavras de dentro para fora e de fora para dentro. Journal of Experimental Psychology: Human Perception and Performance, 7 (3), 538-551.

Uma explicação para essa propriedade do sistema de leitura é que ela resulta do fato de que a posição de uma letra exterior é menos facilmente confundida com letras adjacentes. Há apenas uma direção na qual uma letra externa pode se mover, e há menos letras adjacentes para 'mascarar' uma letra externa. Ambas as propriedades surgem muito naturalmente de um modelo de rede neural no qual as letras são identificadas em diferentes posições em uma retina artificial.

Shillcock, R., Ellison, T.M. & amp Monaghan, P. (2000). Comportamento de fixação ocular, armazenamento lexical e reconhecimento visual de palavras em um modelo de processamento dividido. Psychological Review 107, 824-851.

O relato proposto por Richard Shillcock e colegas também sugere outro mecanismo que poderia estar em funcionamento no meme. Eles propõem um modelo de reconhecimento de palavras em que cada palavra é dividida ao meio, já que a informação na retina é dividida entre os dois hemisférios do cérebro quando lemos. Em algumas das simulações de seu modelo, Richard Shillcock simula o efeito de letras embaralhadas em cada metade da palavra. Parece que manter as letras na metade apropriada da palavra reduz a dificuldade de leitura de texto confuso. Essa abordagem foi usada na geração do exemplo (1) acima, mas não para (2) ou (3).

5) Nenhuma das palavras com letras reordenadas cria outra palavra (wouthit vs witohut) Sabemos, por meio de trabalhos existentes, que palavras que podem ser confundidas trocando letras interiores (por exemplo, sal e ripa) são mais difíceis de ler. Para tornar uma palavra confusa fácil de ler, você deve evitar criar outras palavras.

Andrews, S (1996) Lexical retrieval and selection process: Effects of transposed-letter confusability. Journal of Memory and Language, 35 (6), 775-800.

6) Foram utilizadas transposições que mostram o som da palavra original (por exemplo Toatl vs ttaol para total) Isso ajudará na leitura, uma vez que muitas vezes prestamos atenção ao som das palavras, mesmo quando lendo para o significado:

Van-Orden, G. C. (1987) A ROWS is a ROSE: Spelling, sound, and reading. Memory and Cognition, 15 (3), 181-198.

7) O texto é razoavelmente previsível. Por exemplo, dadas as primeiras palavras da frase, você pode adivinhar quais palavras vêm a seguir (mesmo com muito pouca informação das letras da palavra). Sabemos que o contexto desempenha um papel importante na compreensão da fala que é distorcida ou apresentada no ruído, o mesmo provavelmente é verdadeiro para o texto escrito que foi misturado:

Miller, G. A., Heise, G. A., & amp Lichten, W. (1951). A inteligibilidade da fala em função do contexto dos materiais de teste. Journal of Experimental Psychology, 41, 329-335.

Tihs é porque o huamn mnid deos não raed ervey lteter por istlef, mas o wrod como um wlohe. Isso ocorre porque a mente humana não lê todas as letras por si mesma pela palavra como um todo.

Duas idéias estão sendo sugeridas nesta frase. Essencialmente, o autor está correto, as pessoas normalmente não lêem cada letra de uma palavra individualmente - exceto em uma condição relativamente rara após lesão cerebral conhecida como leitura letra por letra, conforme descrito a seguir:

Warrington, E.K., & amp Shallice, T. (1980). Dislexia em forma de palavra. Brain, 103, 99-112.

Também há evidências que sugerem que a informação na forma de uma palavra inteira desempenha um papel importante na leitura. Por exemplo, "CaSe MiXiNg" retarda substancialmente a leitura:

Mayall, K., Humphreys, G.W., & amp Olson, A. (1997). Interrupção no processamento de texto ou carta? As origens dos efeitos de mistura de casos. Journal of Experimental Psychology: Learning, Memory, & amp Cognition, 23, 1275–1286.

No entanto, como o "formato da palavra" inclui informações sobre a posição das letras internas (especialmente onde elas contêm elementos ascendentes e descendentes), o formato da palavra será interrompido pelas transposições.

Após breves apresentações de palavras escritas, as pessoas geralmente são melhores em adivinhar que palavra viram, em vez de adivinhar as letras individuais dessa palavra (o "Efeito de superioridade da palavra"):

Reicher, G. M. (1969) Reconhecimento perceptivo como função da significância do material de estímulo. Journal of Experimental Psychology. 81 (2), 275-280.

No entanto, esta demonstração não implica que a leitura não envolva qualquer processo que ocorra no nível de letras individuais. Um artigo recente na Nature apresenta uma nova peça de evidência para processos de nível de letra na leitura de palavras:

Pelli, D. G., Farell, B., Moore, D.C. (2003) A notável ineficiência do reconhecimento de palavras, Nature, 423, 752-756.

Neste artigo, Pelli e colegas mostram que, ao ler palavras que foram distorcidas pela apresentação de cada letra em ruído visual (como uma televisão desafinada), os leitores não têm um desempenho tão bom quanto um 'observador ideal' que pode reconhecer palavras com base em sua forma sozinha. Em vez disso, seus participantes apenas se saíram tão bem quanto poderiam se estivessem reconhecendo palavras com base em suas letras individuais.

Claramente, o debate sobre se lemos usando informações de letras individuais ou de palavras inteiras está longe de terminar. Demonstrações da facilidade ou dificuldade de leitura de textos confusos parecem provavelmente desempenhar um papel importante em nossa compreensão desse processo. Por exemplo:

Perea, M., & amp Lupker, S. J. (2003). O jugde ativa TRIBUNAL? Efeitos de confusibilidade de letras transpostas em priming associativo mascarado. Memória e cognição.

Outro artigo extremamente relevante que acabou de me chamar a atenção é este:

Perea, M., & amp Lupker, S. J. (2003). Efeitos de confusibilidade de letras transpostas no priming de forma mascarada. Em S. Kinoshita e S. J. Lupker (Eds.), Masked priming: State of the art (pp. 97-120). Hove, Reino Unido: Psychology Press.

O que Perea e Lupker fizeram foi apresentar palavras para decisão lexical (esta é uma palavra real?) E medir os tempos de resposta para pressionar um dos dois botões (sim / não). Essas palavras-alvo são precedidas por apresentações muito breves (50 mseg) de outra sequência de letras, que é mascarada e, portanto, invisível para os participantes. No entanto, a influência dessa palavra mascarada pode ser mostrada nos tempos de resposta. Por exemplo, os tempos de resposta são mais rápidos se USHER for precedido por "uhser" do que se precedido por "ushre". Ou seja, as transposições da letra intermediária "primam" uma palavra vizinha mais do que as transposições das letras extremas. O mesmo fenômeno que está no cerne da demonstração anterior.

Eu ficaria muito grato por quaisquer comentários e sugestões que as pessoas tenham nesta página, seja qual for o seu nível de conhecimento. Tentarei atualizar esta página com mais informações sobre o meme da internet e sobre trabalhos relacionados à leitura, se houver interesse. Talvez um dia haja um grupo de pesquisadores da Universidade de Cambridge que fará uma descoberta científica ao estudar a leitura de um texto confuso.

Outros comentários:

1) Ted Warring postou um link para um algoritmo que é muito melhor do que humanos para decifrar texto embaralhado. Isso talvez não seja surpreendente - tenho certeza de que não sou a única pessoa por aí que usou um programa de computador para resolver um anagrama particularmente difícil.

2) Bruce Murray, da Auburn University, Alabama, EUA aponta a seguinte citação como representante de uma linha de pesquisa que mostra que erros ortográficos (e transposições de cartas) interrompem o processo de leitura:

"Independentemente da previsibilidade semântica, sintática ou ortográfica, o olho parece processar letras individuais. As interrupções nos movimentos oculares dos leitores adultos indicam que o sistema visual tende a detectar o menor erro ortográfico."

(de Adams, M. J. (1990) Beginning to Read: Thinking and Learning About Print. Cambridge, MA: MIT Press, p. 101)

Há uma questão interessante aqui que é que a impressão subjetiva de dificuldade que se obtém ao ler um texto confuso pode ser bem diferente de uma medida mais objetiva de dificuldade de leitura obtida usando um rastreador ocular (um dispositivo que mede o padrão dos movimentos oculares feitos quando as pessoas lêem o texto impresso).

Bruce também apontou que o texto original e algumas discussões foram postados na "Página de Referência de Lendas Urbanas".

Eu fiz um bom programa de código aberto em Visual Basic, este programa pode fazer a randomização de letras automaticamente para você. Ele randomiza apenas as letras do meio de uma palavra, não altera o lugar da primeira e da última letra, também caracteres especiais como vírgulas e pontos não são afetados. Você pode baixar o programa e fonte aqui:

Você precisará que os arquivos de tempo de execução do Visual Basic estejam em seu sistema se quiser executar o executável. A instalação desses arquivos pode ser encontrada aqui:

4) Clive Tooth encontrou o que pode ser a frase confusa mais ambígua (usando palavras como "sal", que se torna "ripa" quando transposta)

"As sprehas tinham ponits e patles"

Os sherpas tinham pitons e pratos.

Os modeladores tinham pontas e pregas.

Os serafins tinham pintos e pétalas.

Os sphaers tinham pinots e paletes.

Os sphears tinham potins e peltas.

Clive lista algumas das palavras mais obscuras neste conjunto de leituras possíveis:

paletas: paleae (uma parte de uma flor de grama)

sphaers, sphears: ambas as formas antigas de 'esferas'

5) Stephen Sachs escreveu um script CGI para misturar o texto. Simplesmente insira seu texto na página www e pressione o botão para um novo texto embaralhado.

Reconhecimentos:

Agradecimentos a Maarten van Casteren, Kathy Rastle e Tim Rogers pelos comentários e sugestões nesta página.


O sistema límbico do cérebro

O sistema límbico é um conjunto de estruturas cerebrais localizadas no topo do tronco cerebral e enterradas sob o córtex. As estruturas do sistema límbico estão envolvidas em muitas de nossas emoções e motivações, particularmente aquelas relacionadas à sobrevivência, como medo e raiva. O sistema límbico também está envolvido em sensações de prazer relacionadas à nossa sobrevivência, como aquelas experimentadas por comer e fazer sexo. O sistema límbico influencia tanto o sistema nervoso periférico quanto o endócrino.

Certas estruturas do sistema límbico também estão envolvidas na memória: duas grandes estruturas do sistema límbico, a amígdala e o hipocampo, desempenham papéis importantes na memória. A amígdala é responsável por determinar quais memórias são armazenadas e onde as memórias são armazenadas no cérebro. Pensa-se que essa determinação se baseia em quão grande é a resposta emocional que um evento invoca. O hipocampo envia memórias para a parte apropriada do hemisfério cerebral para armazenamento de longo prazo e as recupera quando necessário. Danos a essa área do cérebro podem resultar na incapacidade de formar novas memórias.

Parte do prosencéfalo conhecido como diencéfalo também está incluído no sistema límbico. O diencéfalo está localizado abaixo dos hemisférios cerebrais e contém o tálamo e o hipotálamo. O tálamo está envolvido na percepção sensorial e na regulação das funções motoras (ou seja, movimento). Ele conecta áreas do córtex cerebral que estão envolvidas na percepção sensorial e no movimento com outras partes do cérebro e da medula espinhal que também desempenham um papel na sensação e no movimento. O hipotálamo é um componente muito pequeno, mas importante, do diencéfalo. Ele desempenha um papel importante na regulação dos hormônios, da glândula pituitária, da temperatura corporal, das glândulas supra-renais e de muitas outras atividades vitais.


Assista o vídeo: How to Bypass CaptchaRecaptcha Easily (Dezembro 2021).