Abstract:
Abordagens de aprendizado de máquina têm sido usadas em várias áreas. No campo da pesquisa agropecuária, o aprendizado de máquina tem sido utilizado para aumentar a produtividade agrícola e minimizar seu impacto ambiental, mostrando-se uma importante ferramenta de apoio à tomada de decisões. Diferentes estratégias são encontradas na literatura para prever estágios fenológicos de diferentes culturas. Do estado da arte atual, observamos poucos trabalhos que abordam a previsão da data de colheita. Não encontramos trabalhos com abordagem semelhante ao proposto. Prever a época da colheita é um desafio para desenvolver a produção de frutas de forma sustentável e reduzir o desperdício de alimentos. As frutas são perecíveis, de alto valor e sazonais, e os preços de venda geralmente são sensíveis ao tempo, o que torna as previsões
de colheita extremamente valiosas para os produtores. Este estudo propõe o modelo PredHarv, um modelo de aprendizado de máquina que utiliza redes neurais recorrentes, para prever a data de início da colheita da maçã, dadas as condições climáticas relacionadas à temperatura, esperadas para o período. As previsões são feitas a partir do estádio fenológico da plena floração, com base nas séries históricas da fenologia e dados meteorológicos. O modelo computacional contribui com a capacidade de antecipar informações sobre a data de colheita, possibilitando ao produtor planejar melhor as atividades, evitando custos e melhorando a produtividade. A utilização de métodos de ML visa tornar mais eficaz a capacidade preditiva de modelos baseados em soma térmica voltados para a fruticultura, permitindo simular as mudanças climáticas no período. O modelo PredHarv é baseado em modelos de soma térmica, mas usa uma abordagem
multivariada. Usamos a soma térmica relacionando-a com a duração do período e outras variáveis relacionadas a temperatura do período. Usamos um método de aprendizado de máquina, explorando o potencial das redes LSTM para tratar problemas que envolvem séries temporais. A saída do modelo retorna à duração do período em dias de calendário, dadas as condições climáticas relacionadas a temperatura esperadas para o período. Adicionalmente uma metodologia de utilização do modelo é proposta com o objetivo de ampliar a capacidade preditiva, como forma de reduzir a incerteza implícita nas informações fornecidas pelo usuário, necessárias para o cálculo da previsão. Desenvolvemos um protótipo do modelo PredHarv e realizamos experimentos com dados reais de instituições agrícolas. A combinação das variáveis utilizadas no modelo demonstrou uma estratégia de predição eficaz. Avaliamos as métricas e os resultados obtidos nos cenários de avaliação demonstram que o modelo é eficiente, com boa generalização e capaz de obter resultados com melhor acurácia comparado ao modelo linear baseado em acúmulo térmico.