최근, 챕터39 번째 미국 인공 지능 연례 회의 (AAAI 2025)는 미국 펜실베이니아 주 필라델피아에서 열렸습니다.소프트웨어 아카데미 휴먼-컴퓨터 상호 작용 및 가상 현실 센터MMRC 실험실수업 학생Sun Weilin、Yang Yimeng、Yan Xiaoshuo,소프트웨어 아카데미 인공 지능 연구 센터Ma Zhenxiang, Mima Laboratory의 대학원생회의에 참석하여 보고서 결과를보고합니다.

1.종이질문:계층 적으로 구조화 된 개방형 실내 장면 합성 미리 훈련 된 큰 언어 model (AAAI 2025)
논문의 저자 :Weilin Sun, Xinran Li, Manyi Li*, Kai Xu*, Xiangxu Meng, Lei Meng*
종이컨텐츠:실내 장면 합성 기술은 특히 사용자의 개인화 된 요구를 충족시키는 데 중점을 둔 논리적이고 현실적인 3 차원 실내 환경을 자동으로 생성하기 위해 노력하고 있습니다. 최근 몇 년 동안 미리 훈련 된 대형 언어 모델 (llm)은 실내 장면 합성 분야에서 놀라운 일반화 기능을 보여주었습니다. 그러나 LLM에 의해 생성 된 텍스트 설명을 합리적이고 물리 법칙에 따라 장면 레이아웃으로 변환하는 것은 여전히 순간에 직면 한 주요 과제입니다.

2.종이질문:멀티 모달 권장 사항을위한 커리큘럼 조절 확산(AAAI 2025)
논문의 저자 :Yimeng Yang, Haokai MA, Lei Meng*, Shuo Xu, Ruobing Xie, Xiangxu Meng
종이컨텐츠:멀티 모달 권장 (MMREC)는 프로젝트에서 멀티 모달 정보를 통합하여 협업 기반 권장 사항에 내재 된 데이터 스파스 성을 해결하는 것을 목표로합니다. 전통적인 멀티 모달 권장 방법은 종종 멀티 모달 그래프에서 관찰 된 사용자 행동으로부터 구조 수준의 프로젝트 표현을 캡처하여 개인화 된 선호도 이해에 부정적인 예의 잠재적 영향을 무시합니다.(CNS), 커리큘럼 스타일의 학습 패러다임과 역상과 일치하여 최적화를 향상시키기 위해 골드 표준 음성 인스턴스를 적응 적으로 샘플링합니다. 결과는 세 데이터 세트의 모든 메트릭에서 모든 기준보다 훨씬 우수하다는 것을 보여줍니다.


3.질문:이미지 분류를위한 시각적 비성 론적 정렬 그래프에 대한 인과 추론(AAAI 2025)
논문의 저자 :Lei Meng, Xiangxian Li, Xiaoshuo Yan*, Haokai MA, Zhuang Qi, Wei Wu, Xiangxu Meng
종이컨텐츠:현재 교차 모달 정렬 방법은 주로 세 가지 범주로 나뉩니다. 명시 적 정렬, 암시 적 정렬 및 세분화 된 조정을 통해 안정적인 시각적 및 의미 적 연관성을 구축하기가 어렵습니다. 이미지 분류. 이를 위해 이미지 분류에 대한 세밀한 비전을 제안합니다-시맨틱 협회 모델링 프레임 워크VSCNET, FVA (Fine-Greated Visual Semantic Alignment) 모듈은 순차적 위치 제도를 사용하여 시맨틱 밀도가 높은 영역을 동시에 위치시키고 동시에 해당 텍스트 마커를 추론합니다. 비전 완화-시맨틱 매핑의 오류 전파,이 백서는 사전 학습 비전을 제안합니다-시맨틱 계층 구조는 모달 추론에 대한 불확실성을 처리하고 시각적 패턴, 레이블 및 범주 간의 연결에서 잠재적 범주를 찾습니다. 그 후, 이종 인과 적 그래프를 통해(CIM)전반적인 세밀한 비전-시맨틱 정보 및 레이블의 통합 된 시각적 패턴으로, 인과 관계 정보를 학습하고 강력한 시각적 표현을 형성합니다. 데이터 세트 균형을 유지하여engredient-101 및 Long-Tail 데이터 세트에 대한 실험 결과 VSCNET가 이미지의 비주얼을 효과적으로 구축 할 수 있음을 보여줍니다-시맨틱 연관성, 풍부한 예측 정보의 융합을 통해 분류 효과를 효과적으로 향상시킵니다.

4.종이질문:점차적으로 기능을 갖춘 소수의 세밀한 이미지 분류 정제 및 연속 관계 모델링(AAAI 2025)
논문의 저자 :Zhen-Xiang MA, Zhen-Duo Chen*, Tai Zheng, Xin Luo, Zixia Jia, Xin-Shun Xu
종이컨텐츠: 최근 몇 년, 해결하기위한 많은 효과적인 방법이 제안되었습니다작은 샘플 세그레이드이미지 분류 (fs-fgic)this도전적인 작업. 그러나 백본 네트워크를 완전히 활용하는 방법의 특징Discover and세부 사항Extract능력, togetmore차별적의 클래스 프로토 타입 및 쿼리 샘플과 클래스 프로토 타입 사이의 유사성 관계를 정확하게 모델링하는 방법은 여전히 추가로 고려됩니다2문제. 그러므로,이 기사소설 제안프로그레시브기능정제약식FS-FGIC 방법으로 존재하는이 두 가지 문제를 해결하기 위해 적합합니다. 구체적으로, 우리는 진보적 인 기능을 디자인했습니다정제모듈 (pfrm), tofull백본 네트워크의 점진적인 특성 활용的에너지 추출力33547_33555의 특징더 강화하려면차별적기능. 그 다음에,US지속적인 관계 모델링 모듈을 제안했습니다 (crmm),쿼리를 캡처하려면샘플和해당클래스 프로토 타입 간의 종속성, 따라서 구현在기능 공간에서해당样本점 사이의 거리의 정확한 최적화. 5 개의 작은 곡물 벤치 마크 데이터 세트에 대한 광범위한 실험을 수행했으며 실험 결과는 제안 된 방법이임을 보여줍니다.비교기존 방법성능 구현모든 라운드 리드.

aaaiis인공 지능 프로모션협회 조직최고 인공 지능국제 회의,중국 컴퓨터 협회의 경우CCF는 인공 지능 및 자연어 처리 분야에서 높은 학업 명성을 얻는 클래스 A 국제 학술 회의를 권장합니다. 회의는 총 12,957 개의 기록적인 유효한 제출물을 받았으며 등록률은 약 23.4%입니다.