Notícias
por: Eduardo Kenji Agena
Visualizar arquivo PDF Enviar e-mail para o autor
Ano: 2021
Instituições de ensino: USP - Universidade de São Paulo
Páginas: 2
Idioma: Portugues
Notas:
Perguntas:
1)”Qual a principal mensagem do trabalho?" Para responder a esta pergunta, identifique no artigo qual o problema que os autores procuram resolver
2)"Qual a principal contribuição do trabalho?" Para responder a esta pergunta, identifique no artigo qual a solução reportada pelos autores
3)"Como o trabalho foi avaliado?" Para responder a esta pergunta, identifique no artigo como os autores avaliaram o impacto da solução proposta no problema identificado originariamente
4)"Qual a principal limitação do trabalho?" Para a responder esta pergunta, *analise criticamente* o trabalho apresentado no artigo e identifique uma limitação na solução reportada relativamente ao problema tratado
Sua resposta
1) Perda de representatividade de dados computacionais, modelos de dados computacionais extensos e que ocupam muito espaço em bytes de armazenamento em Hard Disk (Disco Rígido) ou Cloud Computing (Computação em Nuvens), perdas de pistas semânticas presentes em dados computacionais multimodais;
2) As primeiras técnicas de fusão ou junção foram propostas em tarefas de análise de vídeo como uma forma de melhorar a eficiência, eficácia e valores, gerando modelos de dados computacionais compactos e enxutos capazes de manter pistas semânticas presentes em dados computacionais multimodais. As primeiras tentativas de fundir dados computacionais multimodais empregaram operadores de fusão no espaço de recursos de baixo nível, perdendo a representatividade dos dados computacionais. Isso levou a esforços de pesquisas posteriores para evoluir operadores simples para operações complexas, que se tornaram, em geral, inseparáveis do processamento de pistas semânticas multimodais. Neste artigo, investigamos a aplicação dos primeiros operadores de fusão computacional multimodal no espaço de recursos de nível médio. Cinco operadores diferentes (concatenação, soma, grama, média e máximo) foram empregados para fundir recursos de vídeo multimodal de nível médio. Os dados computacionais fundidos derivados de cada operador foram então usados como entrada para duas tarefas de análise de vídeos diferentes: Segmentação de Cena de Vídeo Temporal e Classificação de Vídeo. Para cada tarefa, os autores realizaram uma análise comparativa entre os operadores e técnicas de trabalho relacionadas projetadas para essas tarefas usando operações de fusão complexas;
3)Os resultados de eficiência e eficácia alcançados pelos operadores de fusão de dados computacionais foram muito próximos aos alcançados pelas técnicas de fusão ou junção, apontando fortes evidências de que trabalhar em um espaço de recursos mais homogêneo e uniforme pode reduzir desvantagens conhecidas de fusão de baixo nível. Além disso, os operadores tornam a fusão ou junção de dados computacionais separável, permitindo que os pesquisadores mantenham o foco no desenvolvimento de representações de pistas semânticas;
4) Limitação do trabalho quanto aos recursos financeiros, de mão-de-obra e materiais (suprimentos), destinados a pesquisa e desenvolvimento de técnicas de fusão de dados computacionais enxutos e compactos.
Resumo
As primeiras técnicas de fusão foram propostas em tarefas de análise de vídeo como uma forma de melhorar a eficácia, eficiência e valores, gerando modelos de dados compactos capazes de manter pistas semânticas presentes em dados multimodais. As primeiras tentativas de fundir dados multimodais empregaram operadores de fusão no espaço de recursos de baixo nível, perdendo a representatividade dos dados. Isso levou a esforços de pesquisa posteriores para evoluir operadores simples para operações complexas, que se tornaram, em geral, inseparáveis do processamento de pistas semânticas multimodais.
Neste artigo, investigamos a aplicação dos primeiros operadores de fusão multimodal no espaço de recursos de nível médio. Cinco operadores diferentes (concatenação, soma, grama, média e máximo) foram empregados para fundir recursos de vídeo multimodal de nível médio. Os dados fundidos derivados
de cada operador foram então usados como entrada para duas tarefas de análise de vídeos diferentes: Segmentação de Cena de Vídeo Temporal e Classificação de Vídeo. Para cada tarefa, realizamos uma análise comparativa entre os operadores e técnicas de trabalho relacionadas projetadas para essas tarefas usando operações de fusão complexas. Os resultados de eficácia alcançados pelos operadores foram
muito próximos aos alcançados pelas técnicas, apontando fortes evidências de que trabalhar em um espaço de recursos mais homogêneo pode reduzir desvantagens conhecidas de fusão de baixo nível. Além disso, os operadores tornam a fusão de dados separável, permitindo que os pesquisadores mantenham o foco no desenvolvimento de representações de pistas semânticas.
Visualizar arquivo PDF Enviar e-mail para o autor
Comentários
Veja outros trabalhos acadêmicos
Outros conteúdos
Fórum
Tire suas dúvidas e ajude outras pessoas no CIMM:
Faça seu login
Ainda não é cadastrado?
Cadastre-se como Pessoa física ou Empresa