Grants talk:Project/Automated Portuguese grammar checking edits via LanguageTool

From Meta, a Wikimedia project coordination wiki
Jump to navigation Jump to search

Project Grant proposal submissions due today![edit]

Thanks for drafting your proposal for a Project Grant. Proposals are due today! In order for this submission to be reviewed, it must be formally proposed. When you have completed filling out the infobox and have fully responded to the questions on your draft, please change status=DRAFT to status=PROPOSED to formally submit your grant proposal. This can be found in the Probox template found on your grant proposal page. If you have already done this, thanks for your submission, and you should be receiving feedback from the Project Grants committee in the coming weeks. Thanks, I JethroBT (WMF) (talk) 18:16, 14 March 2017 (UTC)

Thank you Jethro![edit]

Many thanks for the heads up Jethro! I was waiting for a similar information via e-mail, since I had contacted the projectgrants@wikimedia.org regarding this. I am not used to looking into the discussion pages. I have changed this accordingly. Again, many thanks!

Eligibility confirmed, round 1 2017[edit]

IEG review.png

This Project Grants proposal is under review!

We've confirmed your proposal is eligible for round 1 2017 review. Please feel free to ask questions and make changes to this proposal as discussions continue during the community comments period, through the end of 4 April 2017.

The committee's formal review for round 1 2017 begins on 5 April 2017, and grants will be announced 19 May. See the schedule for more details.

Questions? Contact us.

--Marti (WMF) (talk) 19:53, 27 March 2017 (UTC)

Dear Tiago Santos,

Thank you for submitting this proposal. Automatic grammar correction of all Portuguese articles in Wikipedia is an interesting idea. As you may know, however, there are varying opinions among our volunteers about automation, with some appreciating the speed and efficiency of automated processes and some preferring the slower but more nuanced review of a human. Because there are differing opinions about this, we especially like to get feedback from relevant volunteer communities when we receive proposals for automation efforts. In this case, we will want to know whether the Portuguese speaking communities want the service you are offering to provide them. Please try to solicit feedback from as many members of those communities as you can here on this talkpage, either endorsing your proposal because it meets needs they have (their endorsements will be stronger if they can make an effort to articulate those needs), or else describing any concerns they have about it.

If you like, you can reach out to I_JethroBT_(WMF), our community organizer, for ideas about how to solicit feedback.

Kind regards,

--Marti (WMF) (talk) 01:50, 3 April 2017 (UTC)

Dear Marti (WMF),
It is with great pleasure that I hear from you. I am glad to see that the idea makes sense, as I sincerely believe this is a significant project.
I will contact the community again, as well as Jethro. I have used the mailing list to announce the project, and I received some encouraging feedback, although I am not sure that the majority of the members has seen this page. I heed your advice and I will also ask assistance to Jethro.
Past efforts
I do not understand, why similar efforts made in the past by my colleagues did not become a permanent part of the Wikipedia. The languages that I have analyzed are very well developed in their current state, although improvement is possible – a truism.
With this in mind, as I have previously referred, I intend to work with the community, especially with more vocal members against this project, as long as everyone remains assertive and intellectually honest. Those persons may prove to be the checks and balances of this project, and provide very useful feedback.
Personal Bias
I prefer to design rules that assist in the final revision by persons with great command of the language. I am slightly dyslexic and overly hasty, so I may be slightly biased towards a grammar checker that is more permissive with false positives, even if at the current state, the majority of rules is perfectly accurate.
Interaction ideas
Having an enthusiastic and intelligent community that benefits directly from my work, allows me to have more constructive criticism, and creates a goal that demands that I start working against my personal preferences. This seems to be an ideal situation.
I intend to select gradually the rules, and do limited tests that can be observed by the community. When the overall benefit of an automated replacement run is fairly consensual, it will be done.
Worst case scenario
The Wikipedia is gigantic. Let’s try to forecast.
If a first run, running on 40.000 articles, actually corrects 70% of the detection but changes 30% of correct instances, the overall quality of the text has still improved.
This is a very low accuracy estimation, because I will start with a subset of rules that contains the most solid rules, having almost 100% accuracy.
Concerned editors will still save time, correcting errors. To avoid having editor having to fix the same “corrections” constantly, subsequent runs may only apply to other articles, or be done with different rule sets, that have been improved to meet the required standards.
Accepting a revision of 40.000 articles per week, after the first run, it would take 6 months to return to the previous set of Wikipedia articles.
That would only happen if secondary goals were met, but nonetheless, by that time, rules would have been improved significantly, as they have been so far. In this scenario, more “perfect rules” would have been added to the set, increasing the potential benefit of subsequent runs.
Note that all numbers mention here are just rough estimations, without any background study done on them. I do not have yet anything solid in terms of number of articles to be analyzed per run, nor precise accuracy data for individual rules, since these fluctuate with the corpus that is used to make those estimations.
Best regards,
TiagoSantos81 (talk) 20:46, 4 April 2017 (UTC)

WikiPT MailingList discussion[edit]

With intervenients permission I leave here a log of the discussion happening on the mailist. It covers many douts that can exist about the project and it helps other Portuguese only readers to form a better idea about the project.

https://lists.wikimedia.org/pipermail/wikipt/2017-April/thread.html


 ---------------------------------------------------------------------
 [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia
 
 Tiago Santos tiagofsantos81 sapo.pt 
 Quarta-Feira, 5 de Abril de 2017 - 21:01:23 UTC
 Mensagem seguinte: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia
 Mensagens ordenadas por: [ data ] [ tópico ] [ assunto ] [ autor ]
 Estimados senhores,
 
 
 O projeto de correções automáticas para Português passou a primeira fase 
 de seleção.
 
 Tenho recebido algum encorajamento via e-mail, mas é importante que 
 todos os interessados manifestem o seu apoio (ou dúvidas) na página de 
 diálogo do projeto, de forma a que este tenha mais possibilidades de se 
 tornar realidade.
 
 https://meta.wikimedia.org/wiki/Grants_talk:Project/Automated_Portuguese_grammar_checking_edits_via_LanguageTool
 
 A página está em Inglês,que preferencialmente deve ser utilizado, mas 
 caso desconheçam o idioma, eu responderei a questões também em Português.
 
 Espero também que se interessem pelo projeto e que ofereçam criticas 
 construtivas e ideias para melhorias futuras.
 
 
 Grato mais uma vez pela vossa atenção.
 
 Os melhores cumprimentos,
 
 
 Tiago Santos
 ------------------------------------------------
 [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia
 
 Diego Queiroz queiroz.diego gmail.com 
 Quinta-Feira, 6 de Abril de 2017 - 00:22:18 UTC
 Mensagem anterior: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia
 Mensagem seguinte: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia
 Mensagens ordenadas por: [ data ] [ tópico ] [ assunto ] [ autor ]
 Tiago.
 
 Fiquei analisando o caso e, apesar da ideia ser boa, acho que seria
 interessante se aproximar mais do projeto antes de solicitar um IEG. Isso
 vai permitir que, você conheça melhor a Wikipédia, suas regras e as
 ferramentas disponíveis. Ao mesmo tempo, a comunidade te conhecerá e se
 sentirá mais confiante em te ceder apoio.
 
 Sobre sua proposta, eu faço parte do Grupo de Aprovação de Bots e,
 honestamente, eu seria resistente a aprovar um bot que faz edições
 automáticas em artigos corrigindo ortografia ou gramática. Ao mesmo passo
 que edições automáticas são uma mão na roda, pequenos erros as tornam
 extremamente indesejadas. Existem tantos pontos a serem tratados a nível de
 programação antes de realizar uma correção textual, que ficaria surpreso se
 fossem tratados de forma eficiente sem causar uma bela bagunça nos artigos.
 Lembro que, mesmo se o IEG for aprovado, você ainda vai precisar pedir
 aprovação para a Wikipédia local (já poderia ter pedido, inclusive).
 
 Além disso, no IEG você apresenta custos com servidor. Você até deixa claro
 que os custos podem ser reduzidos se alternativas forem utilizadas, mas sua
 falta de envolvimento com o projeto mostra que você não conhece as
 alternativas. A Wikimedia já disponibiliza o WikimediaLabs onde os
 desenvolvedores podem hospedar os projetos relacionados à Wikimedia sem
 custo algum.
 
 Depois, você apresenta uma série de atividades, mas não deixa claro o
 motivo dela requerer um IEG. Em resumo, parece que sua ideia é: ativar o
 Wikicheck (que parece que é algo bastante simples), mas o foco é trabalhar
 no LanguageTool. Não que isso seja um problema, mas parece que o
 LanguageTool tem mais a ganhar do que a Wikipédia, mais ainda se considerar
 que você já é um desenvolvedor ativo dessa ferramenta. Tudo isso torna seu
 pedido questionável.
 
 Claro que é sempre louvável alguém se propor para realizar um projeto que
 possa melhorar a Wikipédia, no entanto, parece conflito de interesse um
 usuário afastado por 8 anos retornar pedindo IEG sem sequer consultar se há
 o interesse da comunidade.
 
 Talvez os colegas da lista discordem do que disse, mas creio que isso
 justifique a falta de apoio.
 
 
 Um abraço,
 
 ---
 Diego Queiroz
 ------------------------------------------------------------------------------
 
 Tiago Santos tiagofsantos81 sapo.pt 
 Quinta-Feira, 6 de Abril de 2017 - 17:31:39 UTC
 Mensagem anterior: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia
 Mensagem seguinte: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia
 Mensagens ordenadas por: [ data ] [ tópico ] [ assunto ] [ autor ]
 Diego,
 
 
 Antes de mais agradeço o tempo que despendeu na resposta e na colocação de algumas questões pertinentes que, espero que sejam serão resolvidas com esta correio eletrónico.
 
 Em relação ao envolvimento na comunidade, acho que foi isso que fiz quando anunciei o projeto na mailing list.
 Como pode ver na página do próprio projeto, há bastantes anos que me envolvo voluntariamente em projetos públicos Open Source, e tenho por norma apresentar-me com algo para oferecer, tal como o fiz nesta lista de discussão.
 Apresentei-me e mostrei que posso contribuir para a comunidade. Algumas pessoas mostraram interesse e contactaram em privado. Umas com informação, outras com dúvidas e outras apenas com um sinal de boas-vindas.
 
 No entanto, é a primeira vez que me insinuam que devia ter “pedida autorização” antes de apresentar uma proposta. Por enquanto, isso é um costume que não é aceite nos países e instituições por onde estive. Tanto quanto sei, também não é política expressa da Wikipédia.
 
 Expressa o projeto como algo fácil. Ativar o Wikicheck e pouco mais. Quase ofensivamente simplista.
 
 Se alguém tentar utilizar o LanguageTool neste momento para edições automatizadas, não vão ter bons resultados e o cenários de alterações destrutivas materializa-se. Criar bots é trabalho, e tanto quanto sei, até ao momento, não existe ninguém a fazê-lo. Se formos a ver, criar um novo servidor para o WikiCheck também é simples, mas não há ninguém a querer mantê-lo. Além de que, só referi WikiCheck expressamente, porque estará disponível para todos os idiomas o que aumenta a relevância do projeto.
 
 Na página do projeto está expresso que as edições são testadas primeiro num extrato da Wikipédia, onde as regras são revistas e aprimoradas. Também é explícito que só quando satisfizerem critérios, a combinar com os interessados, serão utilizadas pelo bot. Note que a decisão será estatística, ou pelo menos decidida a partir de indicadores numéricos.
 Isto também é explicado com algum detalhe na página de discussão do projeto, e até é feita uma previsão de funcionamento.
 
 Dedico bastante do meu tempo livre ao voluntariado a projetos que julgo de interesse global. Além do LanguageTool, tenho sido um dos tradutores mais prolíficos de programas Open Source nos últimos anos, como pode constatar na página da candidatura, mas não tenciono dividir o meu tempo dedicado a voluntariados a mais instituições. Não que eu não ache que a Wikipédia não o merece, mas simplesmente porque o tempo é limitado e todas as pessoas tem prioridades.
 
 O que eu ofereço aqui é um serviço. Pago.
 
 Ofereço aqui porque é uma entidade que estimo, que julgo beneficiar desse serviço, e por concordar com os seus princípios, mas não estou a oferecer tempo pro bono. Sou voluntarioso e esse serviço permite-me continuar a realizar os meus trabalhos pro bono, seja nas traduções ou no corretor gramatical. Também melhora a motivação de continuar a fazê-lo, sabendo que existe uma comunidade considerada e respeitosa por trás destes projetos.
 Os pormenores de desenvolvimento do bot fazem parte do tempo de desenvolvimento. O tempo de desenvolvimento também está explicado em pormenor, e o que consigo fazer a tempo parcial pode ser visto na minha página do GitHub. É pública.
 A estimação de custos de servidor é mínima, e é parte de uma das componentes que pode compensar outros gastos inesperados. Como disse é uma estimação, mas apesar de já ter os componentes alinhavados, ainda não estou a desenvolver a solução.
 
 A proposta, tal como deixa expresso, é investir o tempo na criação dum mecanismo permanente, que liberta os editores duma série de atividades aborrecidas mas necessárias. Isso incluí a criação dum portal para verificação de artigos (o WikiCheck), criação de um bot que faça as edições automaticamente, e o mais importante, seleção e melhoria de regras para que isso possa ser feito.
 Essa é a parte mais complexa e com maior dispêndio de tempo.
 Espero que isto esclareça a situação.
 Os restantes esclarecimentos sobre metodologias e precisão já se encontram na página do projeto e na discussão associada, que pode e deve ser utilizada para esse fim.
 Além disso é bom negócio para todos.
 https://wikimediafoundation.org/wiki/2015-2016_Fundraising_Report
 Se houver um aumento de 0,1% de doações pela melhoria de qualidade da Wikipedia, o projeto já se rentabilizou mais de 10×.
 Isto cria abertura para mais bolsas na comunidade Portuguesa e quem sabe bónus anuais superiores para todos os membros da instituição.
 
 Cumprimentos,
 
 Tiago Santos
 
 ------------------------------------------------------------------------------
 Tiago Santos tiagofsantos81 sapo.pt 
 Quinta-Feira, 6 de Abril de 2017 - 17:34:13 UTC
 Mensagem anterior: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia
 Mensagem seguinte: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia
 Mensagens ordenadas por: [ data ] [ tópico ] [ assunto ] [ autor ]
  > Claro que é sempre louvável alguém se propor para realizar um projeto que
  > possa melhorar a Wikipédia, no entanto, parece conflito de interesse um
  > usuário afastado por 8 anos retornar pedindo IEG sem sequer consultar se há
  > o interesse da comunidade.
 
 
 E em relação a isto não compreendo. Tanto quanto me recordo, nunca 
 contribuí diretamente para a Wikipedia, e este e-mail não tem mais de 1 ano.
 
 ------------------------------------------------------------------------------
 Diego Queiroz queiroz.diego gmail.com 
 Quinta-Feira, 6 de Abril de 2017 - 18:30:42 UTC
 Mensagem anterior: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia
 Mensagem seguinte: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia
 Mensagens ordenadas por: [ data ] [ tópico ] [ assunto ] [ autor ]
 Tiago.
 
 As IEG servem para incentivar o desenvolvimento de pesquisas relacionadas à
 Wikipédia, não para contratar serviços, como você deixou explícito que está
 oferecendo.
 
 A grande maioria dos editores que acompanham essa lista e editam na
 Wikipédia fazem tudo voluntariamente.  Eu sou desenvolvedor e crio bots
 quando tenho tempo, também voluntariamente.  A Wikimedia Foundation é uma
 instituição sem fins lucrativos.  As doações são solicitadas para manter o
 projeto, permitir novas iniciativas e garantir o desenvolvimento da
 fundação.  É descabida a ideia de justificar o seu projeto com o argumento
 de que ele possa, mesmo que indiretamente, aumentar o número de doações e
 "rentabilizar".  Esse claramente não é o objetivo das IEG ou da Wikimedia
 Foundation.
 
 Para saber mais, sugiro que leia:
 
    - https://meta.wikimedia.org/wiki/Grants:Start/About
 
 
 Sobre eu ter achado que estava 8 anos afastado, peço desculpas.  Na página
 do projeto, a Marti (WMF) citou seu nome de usuário na página de discussão
 do projeto como sendo "Tiago Santos" e eu segui essa citação para ver as
 suas contribuições.  Mas só agora vi que seu nome de usuário é
 "TiagoSantos81", que sequer está registrado na Wikipédia em Português.
 Apesar do equívoco, diria que isso só endossa as coisas que eu disse.
 
 
 Atenciosamente,
 
 ---
 Diego Queiroz
 -----------------------------------------------------------------------------
 Tiago Santos tiagofsantos81 sapo.pt 
 Quinta-Feira, 6 de Abril de 2017 - 21:21:47 UTC
 Mensagem anterior: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia
 Mensagem seguinte: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia
 Mensagens ordenadas por: [ data ] [ tópico ] [ assunto ] [ autor ]
 Diego,
 
 
 
 Gostaria, antes de mais, de pedir a sua autorização para colocar esta 
 troca de correio eletrónico pública na página de discussão do projeto, 
 dado que pode esclarecer alguns pontos a outros leitores.
 
 Vou responder em linha para ser mais simples.
 
 > As IEG servem para incentivar o desenvolvimento de pesquisas 
 > relacionadas à Wikipédia, não para contratar serviços, como você deixou 
 > explícito que está oferecendo.
 
 Exatamente. O IEG apresentado é para a conciliação do LanguageTool 
 **com** a Wikipedia, beneficiando ambos. É essa relação, quase 
 simbiótica, que estou a propor.
 
  > A grande maioria dos editores que acompanham essa lista...
 
 Exatamente. Existem alguns que são pagos para o fazer. Por isso mesmo 
 têm obrigações distintas, e têm de oferecer um serviço relevante o 
 suficiente para justificar o financiamento.
 
  > As doações são solicitadas para manter o projeto, permitir novas 
  > iniciativas e garantir o desenvolvimento da fundação.
 
 Exatamente. Esta é uma nova iniciativa, que, se bem sucedida, pode abrir 
 portas para muitos outros projetos relacionados, que, tal como referi, 
 podem-se tornar viáveis com o dinheiro extra recolhido.
 
  > A Wikimedia Foundation é uma instituição sem fins lucrativos.
 
 Se o dinheiro for reinvestido, a Fundação cumpre essa função, e não vejo 
 que forma o meu projeto ou a minha postura vai contra esse principio.
 
 
  > É descabida a ideia de justificar o seu projeto com o argumento de 
  > que ele possa, mesmo que indiretamente, aumentar o número de doações e 
  > "rentabilizar".  Esse claramente não é o objetivo das IEG ou da 
  > Wikimedia Foundation.
 
 Julgo que é assim que todos os projetos viáveis funcionam. Se não 
 funcionam assim, cedo ou tarde tem problemas de contabilidade.
 Acho que ninguém discorda que a Wikipédia é um projeto viável.
 
 
  > Para saber mais, sugiro que leia:
 
  >  - https://meta.wikimedia.org/ <https://meta.wikimedia.org/wiki/Grants:Start/About>
 
 Para usar tanta condescendência, acho deve começar por ler atentamente o 
 projeto e a discussão já tida, porque os argumentos apresentados mostram 
 que não leu ou compreendeu o projeto.
 Também deve ter em conta que isto não é um jogo de soma zero. Se a 
 Wikipedia Foundation obtém mais dinheiro, gasta mais dinheiro. Todos 
 beneficiam: utilizadores, bolseiros, contratados e empreendedores.
 
 Não sei se está a candidatar-se a alguma IEG, ou se tem pretensões de o 
 fazer. Se tem, está a fazer exatamente o oposto do que deveria. Está a 
 enfraquecer a Wikipedia e aumentar ainda mais o nível de com que espera 
 que o seu projeto seja avaliado.
 
 Para mim o mais ofensivo é que aparenta defender que as IEGs existem 
 para premiar contribuidores por familiaridade em detrimento do mérito, 
 algo que também acho que não é alinhado com os princípios anunciados 
 pela Wikipedia.
 
 
 Eu não tenho problemas com dúvidas ou algum criticismo, mas não é isso 
 que está a fazer.
 
 Debate afirmando o projeto como descabido, o que não dá muita abertura 
 para algo construtivo, e parece querer-se fazer representar como a voz 
 de toda a comunidade Portuguese, portanto talvez seja importante dar 
 importância aos pormenores:
 
  > Diego Queiroz
 
 Qual a razão de contestar tão acerrimamente um projeto de óbvia utilidade?
 
 
 Cumprimentos,
 
 Tiago Santos
 ----------------------------------------------------------------------------
 Diego Queiroz queiroz.diego gmail.com 
 Quinta-Feira, 6 de Abril de 2017 - 23:22:53 UTC
 Mensagem anterior: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia
 Mensagem seguinte: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia
 Mensagens ordenadas por: [ data ] [ tópico ] [ assunto ] [ autor ]
 Tiago.
 
 Não quero me prolongar demais nessa discussão, mas vamos lá...
 
    1. Você não precisa da minha autorização para publicar a discussão nessa
    lista. Na verdade, os registros já são públicos e podem ser acessados por
    qualquer um em https://lists.wikimedia.org/pipermail/wikipt/2017-April/
    thread.html . Sugiro que faça o link para a discussão ao invés de
    transcrever o texto no site projeto, para não poluir a página.
    2. Essa lista contém 221 membros inscritos e todos podem se posicionar.
    Eu não falo pela comunidade, falo por mim. Mas falo como membro ativo da
    comunidade e com pleno conhecimento das políticas e ideais do projeto.
    Podem haver colegas que discordam do meu ponto de vista, isso é normal.
    Porém seu projeto já está em fase de ser avaliado e não teve apoio de
    membros ativos da comunidade e essa falta de apoio foi o principal ponto
    questionado pelos avaliadores. Eu posso estar errado, mas os fatos me
    sinalizam que eu tenho alguma razão no que digo.
    3. O ponto que você não entendeu é que você sequer questionou a
    comunidade se ela tem interesse no seu projeto. Já considerou a
    possibilidade da comunidade achar que seu projeto, por melhor que sejam os
    resultados, não deva operar na Wikipédia? Não são apenas questões técnicas
    que definem o que será ativo. Existem questões políticas que determinam
    isso também (alguns editores acham que as edições não devem ser
    robotizadas, por exemplo). Estar em contato com a comunidade e consultar as
    opiniões dela é fundamental.
    Eu posso ir em um instituto de tratamento de câncer e sugerir perucas
    para todos pacientes. Posso até procurar financiamento para desenvolver
    essa minha nobre causa. Mas acho que convém eu perguntar antes se os
    pacientes querem perucas, não acha? Foi exatamente isso que você não fez.
    4. Você tem utilizado a lista para divulgar seu projeto, e insiste nesse
    ponto. De fato, muitos usuários experientes acompanham essa lista, mas já
    lhe ocorreu que uma lista com 221 inscritos não represente uma comunidade
    com quase 2 milhões de usuários? (isso só para citar a Wikipédia em
    Português, vide https://pt.wikipedia.org/wiki/Wikipédia:Estatísticas )
 
 
 Sem mais.
 
 ---
 Diego Queiroz
 ----------------------------------------------------------------------------------
 Alchimista alchimistawp gmail.com 
 Sexta-Feira, 7 de Abril de 2017 - 00:17:44 UTC
 Mensagem anterior: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia
 Mensagem seguinte: [WikiPT] Digest WikiPT, volume 54, assunto 4
 Mensagens ordenadas por: [ data ] [ tópico ] [ assunto ] [ autor ]
 Tiago, o que o Diego tem tentado dizer é que convém perceberes como
 funciona a wikipédia internamente, convém haver algum envolvimento na
 comunidade para perceberes minimamente como funcionam as coisas, o que
 podes fazer, o que não podes fazer e como fazer. Por exemplo, esta mailling
 list é muito pouco usada, as discussões da wikipédia lusófona decorrem
 dentro da Wikipédia, as gerais nas esplanadas [0], conversas mais técnicas
 sobre robôs na coordenação robótica [1], e por ai adiante. (antes de criar
 uma consulta lá convém prestar atenção às informações que têm recebido,
 para poderes fazer o pedido mais percetível à própria comunidade, até
 porque este tema tem tópicos que podem ser discutidos em locais
 específicos).
 
 Neste caso, uma vez que se propõe a fazer as correções de forma automática,
 convém ter em atenção que a Wikipédia lusófona tem uma política de robôs
 [2], e como pode verificar nas Restrições em tarefas específicas, a
 correção de ortografia não é permitida recorrendo a bots. O mesmo acontece
 na versão Anglófona e em praticamente todos os projetos. Aliás, como o
 Diego falou, para um bot poder operar precisa de autorização, e tem de
 tomar muita atenção a este pormenor, porque um bot a editar sem permissão
 resulta em bloqueio.
 
 
 Cordialmente,
 Alchimista
 
 0 - https://pt.wikipedia.org/wiki/Wikip%C3%A9dia:Esplanada
 1 -
 https://pt.wikipedia.org/wiki/Wikip%C3%A9dia:Coordena%C3%A7%C3%A3o_rob%C3%B3tica
 2 - https://pt.wikipedia.org/wiki/Wikip%C3%A9dia:Pol%C3%ADtica_de_rob%C3%B4s
 -----------------------------------------------------------------------------
 Tiago Santos tiagofsantos81 sapo.pt 
 Sexta-Feira, 7 de Abril de 2017 - 17:08:00 UTC
 Mensagem anterior: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia
 Mensagens ordenadas por: [ data ] [ tópico ] [ assunto ] [ autor ]
 Alchimista,
 
 Obrigado pela atenção e o tom construtivo com que se dirige, e por ser 
 alguém "da comunidade", que finalmente,  aponta-me para soluções.
 
 No entanto tenho que discordar de alguns pontos pela sua imprecisão. Vou 
 começar pelos mais relevantes.
 
  >  Restrições em tarefas específicas, a
  >  correção de ortografia não é permitida recorrendo a bots.
 
 
 " Corretores automáticos são fortemente desencorajados, e usados somente 
 em casos especiais. Deve-se ter em conta que é praticamente impossível 
 prever todas as situações, e que mesmo nos casos aparentemente mais 
 simples, existe a possibilidade de falsos positivos, como no caso de 
 livros com títulos que o robô não reconhece como título de livro, sites 
 ou nomes próprios, ou mesmo alterações de variantes linguísticas. Assim, 
 de forma geral, a correção assistida é permitida, tal como em casos 
 específicos com elevada taxa de acerto, contudo a utilização sistemática 
 de corretores ortográficos generalistas não são bem vistos pela comunidade."
 https://pt.wikipedia.org/wiki/Wikipédia:Política_de_robôs#Restri.C3.A7.C3.B5es_em_tarefas_espec.C3.ADficas
 Isto não é um texto legal, portanto: "Corretores automáticos são 
 fortemente desencorajados" deve querer significar: "Corretores 
 automáticos são fortemente desencorajados", algo diferente de "correção 
 de ortografia não é permitida recorrendo a bots."
 
  >  O mesmo acontece
  >  na versão Anglófona e em praticamente todos os projetos
 
 Não propriamente…
 
    - https://www.youtube.com/watch?v=2xmPwefktXI
 [FOSDEM 2014] How we found a million style and grammar errors in the 
 English Wikipedia
 
 Quanto à atribuição de estatutos, existe já um protocolo, que caso o 
 projeto se concretize, se irá realizar como parte do tempo de 
 desenvolvimento.
 
 "
 Atribuição de estatuto
 O sistema de atribuição de estatuto de robô na Wikipédia lusófona é 
 similar ao da Wikipédia anglófona, ou seja, nenhum bot poderá operar sem 
 estar registado (ou em fase de teste).
 
 O operador terá de fazer o pedido, seguindo as instruções indicadas em 
 Wikipédia:Robôs/Pedidos de aprovação.
 Um avaliador, que pode ser um burocrata, um membro do grupo de aprovação 
 de robôs ou um operador de robôs experiente[1], verificará as 
 informações colocadas pelo operador no pedido e as edições feitas pelo 
 editor e pelo robô nos projetos e nas respetivas páginas de discussão do 
 robô, para verificar se têm ocorrido erros.
 Se tudo estiver correto com o operador/robô, o avaliador[1] avisará o 
 operador de que o bot poderá editar na Wikipédia durante cerca de uma 
 semana, em fase de testes. Nesse ínterim, terá de efetuar, no máximo, 
 duas a três edições por minuto (em caso de incumprimento deverá ser 
 bloqueado temporariamente) até atingir cerca de 50 edições.
 Concluída a semana de testes, o autorizador, que pode ser um burocrata 
 ou um membro do grupo de aprovação de robôs[1], verificará as edições do 
 robô, assim como o seu comportamento, e, se não houver problema, emitirá 
 a autorização para o robô operar, atribuindo-lhe o estatuto (caso seja 
 um burocrata), ou comunicando aos burocratas (caso o membro do grupo de 
 aprovação não seja um deles) ou aos stewards (na ausência de burocratas) 
 a aprovação do pedido. Se existir algum erro, o operador terá de se 
 justificar e, mediante a resposta, será atribuído (ou não) o estatuto, 
 podendo ser solicitadas mais edições de teste, ou prolongado o período 
 de testes.
 Nota: A utilização das expressões bot e robô nos nomes de usuários (que 
 não sejam bots) será considerada como imprópria, e o usuário deverá ser 
 avisado caso use tal nome impróprio e bloqueado (por período 
 indeterminado). Se for um robô, terá de fazer o pedido para aprovação do 
 estatuto.
 "
 
 Como vê não é bem como o Sr. Diego referiu. Existem regras bastante 
 explícitas e relativamente fáceis de interpretar.
 
 Por último:
 
  > o que o Diego tem tentado dizer é que convém perceberes como
  > funciona a wikipédia internamente, convém haver algum envolvimento na
  > comunidade para perceberes minimamente como funcionam as coisas, o que
  > podes fazer, o que não podes fazer e como fazer.
 
 O que o Diego tem tentado dizer, foi o que disse. Começou com falácias e 
 argumentos quebrados, porque talvez tenha o hábito de não ser contestado.
 Aliás só no arremate final, mostrou o propósito da sua intervenção:
 
  >   3. O ponto que você não entendeu é que você sequer questionou a
  >   comunidade se ela tem interesse no seu projeto. Já considerou a
  >   possibilidade da comunidade achar que seu projeto, por melhor que sejam os
  >   resultados, não deva operar na Wikipédia? Não são apenas questões técnicas
  >   que definem o que será ativo. Existem questões políticas que determinam
  >   isso também (alguns editores acham que as edições não devem ser
  >   robotizadas, por exemplo). Estar em contato com a comunidade e consultar as
  >   opiniões dela é fundamental.
  >   Eu posso ir em um instituto de tratamento de câncer e sugerir perucas
  >   para todos pacientes. Posso até procurar financiamento para desenvolver
  >   essa minha nobre causa. Mas acho que convém eu perguntar antes se os
  >   pacientes querem perucas, não acha? Foi exatamente isso que você não fez.
 
 Se o objetivo fosse o de elucidar, teria oferecido os outro 3 pontos no 
 primeiro e-mail que dirigiu. Também teria feito perguntas, em vez das 
 afirmações erradas que fez, como se pode confirmar com uma simples 
 consulta à página do projeto.
 
 Sempre disposto, para esclarecer dúvidas, ou a preparar protocolos para 
 mitigar possíveis problemas, desde que a conversa mantenha este nível.
 
 Os melhores cumprimentos,
 
 Tiago Santos
 ----------------------------------------------------------------------------
 Alchimista alchimistawp gmail.com
 Sexta-Feira, 7 de Abril de 2017 - 18:54:10 UTC
 
     Mensagem anterior: [WikiPT] Fwd: Pedido de apoio para bolsa para a Wikipedia
     Mensagem seguinte: [WikiPT] Digest WikiPT, volume 54, assunto 4
     Mensagens ordenadas por: [ data ] [ tópico ] [ assunto ] [ autor ]
 
 Caro Tiago, grande parte do tempo que despendo para a wikipédia anda em
 redor de bots. Tenho vários a realizar inúmeras tarefas, maioritariamente
 na wikipédia Lusófona mas por vezes sou solicitado noutros projetos, tal
 como o Diego sou membro do Grupo de Aprovação de Bots, e a própria política
 de bots fui eu que a elaborei e propus à comunidade. Não digo isto com o
 intuito de o menosprezar, mas simplesmente que entenda que é a àrea onde
 provavelmente estou mais à vontade, portanto o que pretendo é passar-lhe
 algumas informações de que precisa para começar a compreender o
 funcionamento da comunidade e dos procedimentos nesta área.
 
 << Isto não é um texto legal, portanto: "Corretores automáticos são
 fortemente desencorajados" deve querer significar: "Corretores automáticos
 são fortemente desencorajados", algo diferente de "correção de ortografia
 não é permitida recorrendo a bots." >>
 
  A política de bots é o conjunto das regras fundamentais pelas quais os
 bots se devem reger, cada projeto tem as suas regras específicas, embora
 todas andem em redor dos mesmos parâmetros. Este é um ponto essencial que
 precisa perceber e ter em conta. Salvo casos especiais em tarefas
 específicas e em projetos específicos, os bots precisam de aprovação por
 parte da comunidade local, caso contrário são bloqueados, e em casos de
 insistência tratados como vandalismo. Em termos wikipédicos, a Política de
 Bots é o "texto legal" pelos quais os bots devem reger-se, de uma forma
 muito suscita.
 
  Sobre a parte específica dos corretores ortográficos, o texto não proíbe
 taxativamente qualquer correção de ortografia automática para permitir que
 casos específicos possam ser corrigidos, coisas simples, com uma taxa de
 erro residual e com o apoio da comunidade.
 
 No caso inglês, o caso é idêntico ao Lusófono, para um bot poder operar tem
 de cumprir a política e ser aprovado por um processo similar, aliás, foi a
 baseado no anglófono que se instituiu a política e a aprovação de bots
 lusófona. Não vi o vídeo todo, mas pelo que percebi, o que mostram não é um
 bot, mas sim uma ferramenta, pode dar-me indicação do minuto para poder
 verificar a solução apresentada?
 
   < Quanto à atribuição de estatutos, existe já um protocolo, que caso o
 projeto se concretize, se irá realizar como parte do tempo de
 desenvolvimento. >
 Aqui parece haver confusão, a que protocolo se refere?
 
 Estes são os pontos mais importantes que penso que convém analisar para já,
 mas reafirmo o conselho de consultar as documentações, envolver-se com a
 comunidade e tentar perceber o seu funcionamento. Repare que o próprio
 Diego lhe indicou o Wikimedia labs [0], ou seja, não é preciso investir no
 alojamento / servidor, e sinceramente, penso que em vez de bot, o mais
 apropriado seria uma ferramenta lá.
 
 
 Cordialmente,
 Alchimista
 
 
 PS Desculpem o texto truncado no outro mail, o touchpad ganhou vida
 PS.2 Tiago, tenta responder nesta thread, senão fica uma coisa complicada
 de seguir.
 
 ----------------------------------------------------------------------------
 Tiago Santos tiagofsantos81 sapo.pt
 Sábado, 8 de Abril de 2017 - 20:08:42 UTC
 
     Mensagem anterior: [WikiPT] Fwd: Re: Fwd: Possível registo malicioso
     Mensagens ordenadas por: [ data ] [ tópico ] [ assunto ] [ autor ]
 
 Caro Alquimista,
 
 
 Não tento presumir que sei mais sobre a Wikipédia, que qualquer um dos 
 aqui presentes.
 
 Aliás, tanto o Alquimista como o Sr. Diego estão a ser humildes, dado 
 que além de pertencerem ao grupo de aprovação de bots pertencem ao grupo 
 restrito de 8 burocratas que regem atualmente a Wikipédia Portuguesa.
 
 A questão é que, assim que aqui entrei, foi-me recordado que isto é uma 
 instituição politizada. Como tal, devo reger-me pelos seus termos 
 públicos objetivos, tal como os que mencionei, utilizando referências 
 das próprias ligações que me ofereceu.
 
 
  > Em termos wikipédicos, a Política de Bots é o "texto legal" pelos 
 quais os bots devem reger-se, de uma forma
 muito suscita.
 
 
 A referência a legal, foi com intuito de aligeirar a conversa. Mas eu 
 explico. As palavras em texto jurídicos são sempre mais do que a sua 
 interpretação superficial (p.ex. memorando de entendimento).
 
 O mesmo não se costuma passar com regulamentos.
 
 Foi exatamente por considerar a página apresenta como "a lei da terra" 
 que me regi por ela. Exatamente por querer fazer as coisas de forma 
 aprovada é que me interessei pelo regulamento. Se existir algo relevante 
 mais objetivo e concreto, por favor, indique-me de forma a que eu o 
 analise e possa continuar com uma conversa informada, assim como a 
 procurar soluções que se enquadrem nos parâmetros já estabelecidos.
 
 Se são regras, devo sabe-las em pormenor.
 
 
  > Sobre a parte específica dos corretores ortográficos, o texto não 
 proíbe taxativamente qualquer correção de ortografia automática para 
 permitir que casos específicos possam ser corrigidos, coisas simples, 
 com uma taxa de erro residual e com o apoio da comunidade.
 
 
 Esta foi a parte que eu li. Taxativamente não existe nada de objetivo. 
 Para mim, regras objetivas e números são importantes.
 
    Quais são os parâmetros de análise?
 
    Percentagem de falsos positivos e corpus de amostragem necessário (n)?
 
    O que é considerado uma utilização de recursos computacionais 
 razoável por cada ciclo?
 
 Foi isso que referi que iria ajustar com o começo do projeto, apesar de 
 o ter feito com termos de merceeiro de forma a que seja fácil para 
 qualquer um entender a lógica subjacente.
 
 Dependendo dos critérios definidos, os meus critérios de seleção e 
 aperfeiçoamento de regras será ajustados.
 
 Aliás, eu não quero envolver-me em ortografia, ou em questões de 
 gramática dúbias e polémicas que tendem a entreter académicos.
 
 A secção portuguesa do LanguageTool separa as várias variantes, mas tem 
 uma componente que é comum a todas variantes.
 
 É exatamente esse sub-conjunto de regras que é comum que será 
 trabalhado. O meu objetivo não é tornar a Wikipédia mais próxima do MEU 
 Português, mas torná-la mais próxima de um Português correto. Para isso 
 só serão utilizadas as regras comuns a todas as variantes.
 
 
  > No caso inglês, o caso é idêntico ao Lusófono, para um bot poder 
 operar tem de cumprir a política e ser aprovado por um processo similar, 
 aliás, foi a baseado no anglófono que se instituiu a política e a 
 aprovação de bots lusófona. Não vi o vídeo todo, mas pelo que percebi, o 
 que mostram não é um bot, mas sim uma ferramenta, pode dar-me indicação 
 do minuto para poder verificar a solução apresentada?
 
 Esse é o LanguageTool geral. Outras sub-ferramentas dão um extrato das 
 correções.
 
 Para um excelente exemplo de ação de um bot semelhante:
 
 https://ca.wikipedia.org/wiki/Especial:Contribucions/Langtoolbot
 
 
  > mas reafirmo o conselho de consultar as documentações, envolver-se 
 com a comunidade e tentar perceber o seu funcionamento.
 
 Já deve ter percebido, que eu até vejo documentação e de uma forma 
 séria. Mas reafirmo que não comecei a desenvolver.
 
 
  >  Repare que o próprio Diego lhe indicou o Wikimedia labs [0], ou 
 seja, não é preciso investir no alojamento / servidor,
 
 Eu já tinha sido previamente informado desse recurso (que eu já 
 conhecia). Até analisar toda a informação necessária sobre ele, não me 
 posso comprometer a utilizá-lo. Dependendo de muitas questões distintas, 
 pode ser mais viável pagar pelo alojamento, apesar de qualquer poupança 
 ser bem-vinda. Muitas questão podem tornar essa alojamento inviável ou 
 indesejável. Nem tudo o que não rebato, indica que concordo.
 De todos os modos, os custos máximos de alojamento que estimei são menos 
 de 8% do valor pedido para a proposta base, sem compromisso de 
 manutenção. Os custos máximos de alojamento seriam, também, para a 
 proposta máxima.
 
 
  >  penso que em vez de bot, o mais apropriado seria uma ferramenta lá.
 
 Existem imensos projetos possíveis, incluso para outros idiomas 
 distintos. Mas a proposta é a que coloquei. Só são moldáveis os 
 critérios finais de aprovação e a forma como serão realizados.
 
  > envolver-se com a comunidade e tentar perceber o seu funcionamento.
 
    Quem é a comunidade?
    Não é o que estou a fazer?
 
 Estou a falar consigo, e já falei com mais algumas pessoas, algumas de 
 forma pública como pode constatar.
 Mas...
 
    A comunidade são:
       os administradores;
       os burocratas;
       os utilizadores com contribuições;
     ou
       é o total de utilizadores?
 
    Qual o modo mais fácil de contactar diretamente os 2 milhões de 
 utilizadores registados e fazer uma votação?
    Seria interessante aferir a opinião da comunidade no seu todo desta 
 forma. É possível?
 
 Espero que seja possível contar com o apoio dos membros mais experientes 
 para resolver estas questões, dado que não consegui encontrar Wikipédia 
 com este tipo de respostas.
 
 
 Os melhores cumprimentos,
 
 Tiago Santos

Round 1 2017 decision[edit]

IEG IdeaLab review.png

This project has not been selected for a Project Grant at this time.

We love that you took the chance to creatively improve the Wikimedia movement. The committee has reviewed this proposal and not recommended it for funding, but we hope you'll continue to engage in the program. Please drop by the IdeaLab to share and refine future ideas!


Next steps:

  1. Visit the IdeaLab to continue developing this idea and share any new ideas you may have.
  2. To reapply with this project in the future, please make updates based on the feedback provided in this round before resubmitting it for review in a new round.
  3. Check the schedule for the next open call to submit proposals - we look forward to helping you apply for a grant in a future round.

Questions? Contact us.


Aggregated feedback from the committee for Automated Portuguese grammar checking edits via LanguageTool[edit]

Scoring rubric Score
(A) Impact potential
  • Does it have the potential to increase gender diversity in Wikimedia projects, either in terms of content, contributors, or both?
  • Does it have the potential for online impact?
  • Can it be sustained, scaled, or adapted elsewhere after the grant ends?
5.4
(B) Community engagement
  • Does it have a specific target community and plan to engage it often?
  • Does it have community support?
5.1
(C) Ability to execute
  • Can the scope be accomplished in the proposed timeframe?
  • Is the budget realistic/efficient ?
  • Do the participants have the necessary skills/experience?
5.4
(D) Measures of success
  • Are there both quantitative and qualitative measures of success?
  • Are they realistic?
  • Can they be measured?
3.3
Additional comments from the Committee:
  • If properly developed the online impact potential is large. However the tool will probably require continuous maintenance to be sustainable. Adaptation to other languages will not be easy.
  • While it is rather well-positioned regarding strategic priorities (improving content quality), it has problems with impact (Portuguese community seems to be against spellchecking bots) and especially with sustainability (this project will need funding of server costs and costly maintenance, while most bots are open-source and available on labs).
  • The approach is iterative. The risks appear to be relatively high and clear measures of success are lacking.
  • The solution of an automated spellchecker is rather good and probably a good iteration of what was done on other projects. Unfortunately, there is no strategy to mitigate the main risk: Portuguese community is likely not to approve this bot.
  • The applicant probably has the necessary skills to execute the software related part of the project but am not sure about the community related part of the project. The budget is probably realistic.
  • While the applicant seem to have necessary skills, I have serious doubts regarding accomplishment of this project: it is too costly (e.g. server costs are unnecessary as Labs are free) and it might be denied by the community.
  • There is little information about engagement with the Portuguese Wikipedia community although it is the critically important part of the project.
  • An attempt to engage with the Portuguese community failed. The applicant is not active on Portuguese Wikipedia and what he proposes seems to be prohibited by local rules (spellchecking bots generally not allowed).
  • Low engagement, but there is some.
  • Doesn't seem to be an especially active user and seems unfamiliar with the conventions of the wiki. But he is an experienced dev and he is relatively inexpensive.
  • I will not support the project this time. The project idea (producing a reliable grammar checking tool) is interesting but the proposal itself should be improved.
  • I am not sure if we are paying for running language tool.
  • While the idea in itself is good, it will be hard to implement it without support from local community. It is especially true regarding local policy on spellchecking bots as they are in general prohibited. I would encourage applicant to look more into 1) how spellchecking works on other wikis and 2) into Portuguese Wikipedia bot policy, then re-apply with a proposal that works with both.