terça-feira, 19 de novembro de 2024

O Estado financiar um "chatGPT português" é uma parolada que só serve para dar dinheiro a amigos do PSD.

O problema de Portugal é o Estado ir sempre a reboque das modas.

O povo português gosta de viver na mentira da grandiosidade. Se exageramos a história mais exageramos o nosso futuro potencial. 

Sines vai ser o porto mais importante da Europa, o Aeroporto de Lisboa vai movimentar mais passageiros  do que o Aeroporto de Paris, o TGV vai transportar mais de 100 mil pessoas por dia entre Lisboa, Porto e Madrid. 

Nessa loucura colectiva, quem não se lembra da declaração do Galamba de que Portugal vai ser o grande fornecedor de "hidrogénio verde" para a Europa e que levou  à entrega de milhões e milhões aos amigos do PS e dos quais só resultou em prejuízo para o contribuinte (Fusion Fuel insolvência)?

Outra loucura é a dessalinização de água para o Algarve que é uma tecnologia caríssima, pelo menos 10 vezes mais caro em comparação com a construção de barragens e o uso de água do Alqueva?

Apesar de, considerando os 25 anos desde que entramos no euro, o crescimento médio da economia ser de 1,9%/ano, não faltam anúncios de que, com as "novas políticas", vamos quadruplicar esta taxa dos últimos 25 anos passando a crescer acima dos 3,5%/ano.

Fig. 1 - Evolução do PIB português, valores trimestrais a preços constantes de 2021 (dados, INE)

Os parolos que agora controlam o Estado vão "fazer o chatGPT português".

Uns parolos, onde se incluía o reitor da universidade do porto, tudo com letra pequena pois os parolos não merecem mais, fizeram uma reunião em Macau para defender o uso da língua portuguesa na universidade de Macau.

O problema é que o parolo reitor parece que se esqueceu que já praticamente não se ensina em português nos cursos de mestrado da universidade do porto. Com a ideia parola da "internacionalização", os brasileiros têm de assistir as aulas ministradas em inglês!!!!!!!!!!!!!!!


Ninguém avaliou a vantagem para Portugal de ter alunos estrangeiros nas universidade públicas!

Qual a vantagem de ter alunos estrangeiros, que entram com notas muito inferiores às dos portugueses, a frequentar as nossas universidades?

As universidade privadas, tudo bem, é um negócio financiado pelos alunos e têm no mercado internacional uma oportunidade de realizar "vendas". As universidades públicas são financiadas pelos nossos impostos, não faz qualquer sentido estar a financiar pessoas dos outros países.

Mesmo que os estrangeiros paguem um pouco mais de propinas, esses lugares, com essas propinas, têm de ser disponibilizadas aos portugueses em condições de igualdade.

Artigo 13.º (Princípio da igualdade) 1. Todos os cidadãos têm a mesma dignidade social e são iguais perante a lei. 2. Ninguém pode ser privilegiado, beneficiado, prejudicado, privado de qualquer direito ou isento de qualquer dever em razão de ascendência, sexo, raça, língua, território de origem, religião, convicções políticas ou ideológicas, instrução, situação económica, condição social ou orientação sexual (CRP).


Vamos agora à parolada do "chatGPT" português (chat_amália).

O chatGPT tem por base um modelo de tratamento de dados. Eu escrevi um texto sobre esse modelo mas é muito complexo para o apresentar aqui na sua globalidade, desculpem, mas vou dar apenas uma pequena ideia usando um modelo antigo e pouco poderoso.

Pegando num conjunto grande de textos, começo por dividir todas as frases em sequências de 6 palavras (6 é um número exemplificativo). Por exemplo, decomponho a primeira frase do parágrafo anterior em 7 sequências de palavras:

1) O chatGPT tem por base um 

2) chatGPT tem por base um modelo

3) tem por base um modelo de

4) por base um modelo de tratamento

5) base um modelo de tratamento de

6) um modelo de tratamento de dados

7) modelo de tratamento de dados.

Depois, com milhões e milhões de sequências, vou construir uma tabela com todas as sequências que têm as primeiras 5 palavras iguais como a "origem" (é o contexto) e a última palavra como a "seguinte" (é o texto gerado). A tabela vai ter todas as alternativas possíveis, com uma frequência relativa associada a cada uma das alternativas.

Fig. 2 - A aprendizagem do modelo traduz-se na construção de uma tabela com todos os casos possíveis

Agora, quando escrevermos "Quando fui à praia pensei que não há nada como o", o algoritmo vai propor "amor" como a palavra seguinte (por ser a mais frequente nos textos usados na aprendizagem).

O chatGPT é um modelo muito mais sofisticado e que usa um contexto muito grande, talvez 4000 palavras, para prever cada uma das palavras seguintes. Além disso, não usa as palavras directamente mas uma "transformação" (no chatGPT, PT quer dizer Pre-Training Transformer).


Não é possível fazer um "chatGPT" português.

Para treinar o modelo, isto é, para construir a "tabela", são necessários milhões e milhões de textos o que demora muito tempo e é um trabalho repetido, isto é, se a chatGPT já gastou milhares de milhões de euros, sim, milhares de milhões de euros e não os 20 ou 30 milhões que falam os parolos, para aprender todos os textos disponíveis na internet, será uma perda de tempo e de dinheiro voltar a aprende-los, fica muito mais barato usar o que a chatGPT.

É equivalente ao Irão estar a gastar milhares de milhões no desenvolvimento da tecnologia nuclear que já foram gastos pelos países ocidentais (ficaria muito mais barato o Irão usar gás natural ou mesmo comprar uma central nuclear à França).

Também, muitos dos textos são privados, havendo necessidade de pagar direitos de autor. O chatGPT já negociou o acesso a esses documentos, sendo muito difícil fazer contratos com todas as partes que têm direitos de autor.

Finalmente, muito conhecimento está escrito em línguas estrangeiras pelo que não é possível um modelo em português ter acesso a esse conhecimento. A chatGPT tem um modelo de tradução entre línguas altamente potente, capaz de "ler" e "escrever" de forma perfeita nas mais diversas línguas do mundo.


Será que o chatGPT escreve mal em "Português de Portugal"?

Não, escreve de forma perfeita. Se pedirmos "Guarda na memória que quero textos em português de Portugal", a partir daí, sai um perfeito "português de Portugal".

Se disser, "Guarda na memória que quero textos em ucraniano", sai ucraniano perfeito!


Para quê essa parolada do "português de Portugal" e da "informação correcta"?

Isso é apenas para dar 20 ou 30 milhões de euros aos amigos do PSD que mais não vão fazer do que uma interface ao chatGPT usando a API.

Não será isto também o sonho de todos os ditadores? Controlar a "verdade", excluindo dela todos os que pensam de forma diferente? Interessante que no meu processo, o parolo do reitor começa por dizer "a universidade do porto defende a liberdade de expressão e diversidade de pensamento" mas borra logo a pintura com a palavra que vem a seguir "mas".

A liberdade de expressão e de pensamento é termos de ouvir o que não concordamos e mesmo aquilo que temos a certeza de estar errado pois o passado demonstra que parte do que o poder achou errado, executando pensadores de forma cruel, acabou por se afirmar como o verdadeiro. Nem tudo que se afirmou no passado se afirmou como verdadeiro mas, mesmo que tenha sido pouco, mostra ser provável que o que os poderosos de hoje assumem como a verdade pode estar errado.

Os parolos decidem os textos que vão ser aprendidos e, depois, os amigos do PSD carregam esses textos no chatGPT pagando por palavras introduzida e palavras resultantes.

Fig.3 - O chatGPT tem um precário para quem pretende "acrescentar" informação privada ao modelo. Em média, cada palavra são cerca de dois tokens.

Quando faz sentido "comprar" aprendizagem do chatGPT?

Quando uma empresa tem informação privada e que não quer disponibilizar para consulta geral e em que a informação não interessa a quase ninguém.

1) Quando uma empresa desenha um novo processador, para reduzir custos e aumentar a produtividade, tenta usar partes já desenhadas nos processadores mais antigos. Estas partes comportam-se como se fossem "tijolos" que vão ser combinados de forma diferente para fazer a "nova construção". Como interessa que os "tijolos" sejam mantidos secretos, a empresa precisa construir um sistema pericial que aprenda com os desenhos dos processadores anteriores mas que a informação se mantenha dentro da empresa.

2) Uma empresa que monta computadores faz combinações personalizadas de componentes, diferentes disco, memória, processador, placa-gráfica, sistema operativo, software, etc. e precisa comunicar as características particulares de cada componente e o preço a pedido de cada cliente potencial. Esta informação está em documentação privada e não interessa a quase ninguém sendo necessário "mastigar" toda essa informação de forma a construir um call-center que responda de forma automática aos pedidos.

3) Uma sociedade de advogados tem uma base de dados com todas as acções que patrocinou (e que é informação confidencial) e pretende, quando tem um novo caso, construir o articulado recuperando parte do trabalho já feito nas acções que estão na base de dados e cujo resultado foi favorável.

4) Um hospital tem uma base de dados clínicos de todos os doentes que, no passado, foram admitidos e tratados. Esta informação é confidencial e o hospital pretende usar a informação para construir um sistema automático de triagem que, de forma automática, atribua um nível de gravidade a cada novo paciente.


O que faria sentido?

Ensinar as pessoas a usar os modelos que existem no sentido de criarem mais valor.

Mas para isso é preciso redesenhar todo o conteúdo programático das escolas, de cima a baixo, e isso vai contrariar a estagnação que existe nas mentes dos mandantes.

O mais fácil e cómodo para quem manda é proibir sobre o argumento de que "essas coisas só dizem mentiras", fakenews.


Mas será que a verdade existe?

Todos queremos a creditar que a Verdade é o que é verdadeiro e, logo, existe em absoluto.

Mas a verdade no concreto não é  colecção dos factos, vai para além disso porque os factos observados são apenas uma amostra da realidade (quantas estrelas haverá no universo?). 

A verdade tem de ser compatível com os factos mas é uma construção, organização, codificação que é feita no cérebro, com ligações entre neurónios, que abarca os factos da amostra mas que também é uma generalização que abarca o que vai existir fora do observado seja no futuro em em locais distantes.

Todos aceitamos que a Lei da Gravidade observada na Terra se aplica a todo o Universo, mesmo à parte que não é observável.

Como a codificação não existe sem informação prévia (uma criança apenas compreende a língua de quem a rodeia), a verdade vai ser diferente para cada indivíduo.


Vejamos um exemplo gráfico.

Existe o ponto 0 que foi construído pelo cérebro usando toda a história vivida e pensada pelo indivíduo. Como a história dos indivíduos é diferente, este ponto também é diferente de indivíduo para indivíduo.

Depois, existem 3 pontos que são observados por toda a gente e que traduzem o que existe e é observável, é a Natureza de hoje, a realidade (pontos vermelhos). 

Por causa de os indivíduos terem a priori diferentes, apesar de ambas as verdades serem capazes de abarcar os factos observados, a verdade enquanto construção que explica a natureza na sua globalidade, isto é, o ponto 4, é diferente para indivíduos diferentes.

Fig.4 - Representação algébrica da verdade enquanto uma construção sempre compatível com a realidade mas diferente porque usa um a priori que traduz a história de cada indivíduo.


Verdade 1 = 5 - 4.167x + x^2 + 0.167x^3 
Verdade 2 = 0 + 5x - 4x^2 + x^3

Será a verdade absoluta aquela que é construída sem a priori?

Pois seria se fosse possível de ser construída.

E ainda há o problema do Princípio da Incerteza: quem observa altera o observado.


Vemos as diferentes verdades quando explicamos coisas complexas.

Quando, enquanto professores, estamos a expor um certo conteúdo pedagógico, na nossa mente pensamos que os cérebros dos alunos estão a construir uma verdade semelhante à nossa. Acontece que quando damos um exemplo numéricos para os alunos resolverem, o resultado vai ser diferente porque a sua verdade é diferente da verdade do professor.

A diferentes verdades de cada aluno é compatível com a explicação mas dá resultados diferentes quando aplicadas ao exemplo.


Vou acabar com uma anedota ilustrativa (a rã está bem porque isto é apenas uma anedota).

Um cientista pegou numa rã e gritou "Salta para a água" e a rã saltou.

O cientista cortou as patas à rã e voltou a gritar "Salta para a água" e a rã não saltou.

O cientista repetiu a experiência 30 vezes e, com os resultados empíricos, escreveu uma comunicação que foi apresentar a uma conferência. O título da comunicação era "Afinal, as rãs ouvem pelas patas".

Fig. 5 - "Salta para a água" e a rã não saltou :-) 


0 comentários:

Enviar um comentário

Twitter Delicious Facebook Digg Stumbleupon Favorites More

 
Design by Free WordPress Themes | Bloggerized by Lasantha - Premium Blogger Themes | Best Hostgator Coupon Code