*Last updated at Fri Dec 6 18:39:49 2024 (JST).
*The presentation order in each session is subject to change.

Sunday, December 8, 2024 (Day 1)

Tutorial 1

[9:00–12:00] Conference Room 1

"Generative Face Video Coding for Video Conferencing: Introduction, Performance and Challenges"

Prof. Anthony Trioux, Dr. Giuseppe Valenzise, Prof. Shiqi Wang, Prof. Goluck Konuko, Prof. Fuzheng Yang

Tutorial 2

[9:00–12:00] Conference Room 3

"Theory and Applications of Graph-based Nearest Neighbor Search"

Prof. Yusuke Matsui

Tutorial 3

[13:00–16:00] Conference Room 1

"Film Grain Coding for Versatile Video Coding Systems: Techniques, Challenges, and Applications"

Dr. Vignesh V Menon, Dr. Philippe de Lagrange

Tutorial 4

[13:00–16:00] Conference Room 3

"Low-level Image Processing with Diffusion Models"

Dr. Xin Li, Prof. Zhibo

Monday, December 9, 2024 (Day 2)

Keynote 1

[9:00–10:00] Masaru Ibuka Auditorium

"Learning-based Video Compression: from TV to the Metaverse"

Prof. David Bull

Chair: Seishi Takamura (Hosei University)

Oral Session 1

[10:30–12:00] Masaru Ibuka Auditorium

"Visual Coding I"

Chair: Toshiaki Fujii (Nagoya University)

[P-ID 050] Inter-Frame Coding for Dynamic Meshes via Coarse-to-Fine Anchor Mesh Generation (Best Paper Candidate)

He Huang (Shanghai Jiao Tong University); lizhi hou (Shanghai Jiao Tong University); Qi Yang (Tencent); Yiling Xu (Shanghai Jiao Tong University)*

[P-ID 135] Fast Adaptive Loop Filter Algorithm Based on the Optimization of Class Merging (Best Paper Candidate)

Chengkang Huang (State Key Laboratory of Integrated Chips and Systems, Fudan University, Shanghai, China)*; Leilei Huang (Institute of Microelectronic Circuits and Systems, East China Normal University, Shanghai 200241, China); Chang Liu (State Key Laboratory of Integrated Chips and Systems, Fudan University, Shanghai, China); Shuocheng Wang (State Key Laboratory of Integrated Chips and Systems, Fudan University, Shanghai, China); Xu Ke (SaneChips); Yibo Fan (Fudan University)

[P-ID 172] MVCD: Multi-Dimensional Video Compression Dataset (Best Paper Candidate)

Hadi Amirpour (University of Klagenfurt)*; Mohammad Ghasempour (Universität Klagenfurt); Farzad Tashtarian (Klagenfurt university); Ahmed Telili (TII); Samira Afzal (Alpen-Adria-Universitat Klagenfurt); Wassim Hamidouche (TII); Christian Timmerer (Alpen-Adria-Universität Klagenfurt)

[P-ID 183] Vectorized Angular Intra Prediction for Practical VVC Encoding (Best Paper Candidate)

Kari Siivonen (Tampere University)*; Joose Sainio (Tampere University); Guillaume Gautier (Tampere University); Alexandre MERCAT (Tampere University); Jarno Vanne (Tampere University)

[P-ID 252] Efficient Bitrate Ladder Construction for Per-Shot Adaptive Encoding (Best Paper Candidate)

Yan Zhao (Shanghai Jiaotong University); Zhengxue Cheng (Shanghai Jiao Tong University)*; Guo Lu (Shanghai Jiao Tong University); Rong Xie (Shanghai Jiao Tong University); Li Song (Shanghai Jiao Tong University)

Oral Session 2

[10:30–12:00] Conference Room 1

"SS-1: Generative AI for Image/Video Coding"

Chair: Xin Jin (Eastern Institute of Technology)

[P-ID 027] Lossy Coding for Spatially Adaptive Conditioning in Semantic Image Communication

Cem Eteke (Technical University of Munich)*; Alexander Griessel (Technical University of Munich); Wolfgang Kellerer (Technical University of Munich); Eckehard Steinbach (TUM)

[P-ID 122] Perceptual Image Compression With Conditional Diffusion Transformers

Rui Mao (University of Science and Technology of China); Xinmin Feng (University of Science and Technology of China); Changsheng Gao (University of Science and Technology of China); Li Li (University of Science and Technology of China); Dong Liu (University of Science and Technology of China); Xiaoyan Sun (University of Science and Technology of China)*

[P-ID 152] Tell Codec What Worth Compressing: Semantically Disentangled Image Coding for Machine with LMMs

Jinming Liu (Shanghai Jiao Tong University)*; Yuntao Wei (University of Science and Technology of China); Junyan Lin (Ocean University of China); Shengyang Zhao (Ningbo Institute of Digital Twin); Heming Sun (Yokohama National University); Zhibo Chen (University of Science and Technology of China); Wenjun Zeng (Eastern Institute of Technology, Ningbo); Xin Jin (Eastern Institute of Technology, Ningbo, China)

Keynote 2

[13:00–14:00] Masaru Ibuka Auditorium

"Building a Realistic Virtual World from 360˚ Videos for Large Scale Urban Exploration"

Prof. Kiyoharu Aizawa

Chair: Jiro Katto (Waseda University)

Oral Session 3

[14:00–15:30] Masaru Ibuka Auditorium

"SS-2: Lenslet Video Coding and Processing"

Chair: Xin Jin (Shenzhen International Graduate School, Tsinghua University), Mehrdad Teratani (Aichi University of Technology)

[P-ID 053] TSARN: A Joint Temporal-Spatial-Angular Reconstruction Network for Light Field Lenslet Video Compression (Best Paper Candidate)

Huan Li (Shanghai University); Xinpeng Huang (Shanghai University)*; Yongjie Lu (Shanghai University); Ping An (Shanghai University)

[P-ID 133] Advancements in Lenslet Video Coding: Insights from MPEG LVC

Xin Jin (Tsinghua University)*; Mehrdad Teratani (Université Libre de Bruxelles); Byeungwoo Jeon (Sungkyunkwan University); Toshiaki Fujii (Nagoya Univ.); Ruibo Zhao (Tsinghua University); Eline Soetens (Université Libre de Bruxelles); Yuqing Yang (Tsinghua University)

[P-ID 192] Codec-agnostic Lenslet Video Coding with Smoothing Transform

Eline Soetens (Université Libre de Bruxelles)*; Gauthier Lafruit (ULB-LISA); Mehrdad Teratani (Université Libre de Bruxelles)

[P-ID 209] Enhancing Intra Block Copy Prediction for Plenoptic 2.0 Video Coding under Macropixel Constraints

Vinh Van Duong (Sungkyunkwan University); Thuc Nguyen Huu (SKKU); Jong Hoon Yim (Sungkyunkwan University); Byeungwoo Jeon (Sungkyunkwan University)*

[P-ID 267] Multi-view Rendering for Plenoptic 2.0 Videos with Multi-reference Patch Size Estimation

Zhuo Tan (Tsinghua Shenzhen International Graduate School); Xin Jin (Tsinghua University)*

Oral Session 4

[14:00–15:30] Conference Room 1

"Visual Coding II"

Chair: Wen-Hsiao Peng (National Yang Ming Chiao Tung University), Heming Sun (Yokohama National University)

[P-ID 060] Low-complexity learning-based intra prediction with direction-dependent adaptive weights for beyond VVC

Haruhisa Kato (KDDI Research Inc.)*; Yoshitaka Kidani (KDDI Research); Kei Kawamura (KDDI Research)

[P-ID 121] Feature Compression With 3D Sparse Convolution

Yifan Ma (University of Science and Technology of China)*; Changsheng Gao ( University of Science and Technology of China); Qiaoxi Chen (University of Science and Technology of China); Li Li (University of Science and Technology of China); Dong Liu (University of Science and Technology of China); Xiaoyan Sun (University of Science and Technology of China)

[P-ID 123] Content-Adaptive Rate-Quality Curve Prediction Model in Media Processing System

Shibo Yin (Xiaohongshu); Zhiyu Zhang (Shanghai Jiao Tong University)*; Peirong Ning (Xiaohongshu); QIUBO CHEN (Xiaohongshu Inc); Jing Chen (Xiaohongshu); quan zhou (Xiaohongshu); Li Song (Shanghai Jiao Tong University)

[P-ID 184] Frequency-Aware Hierarchical Image Compression for Humans and Machines

yue Luo (Huazhong University of Science and Technology); Zixiang Zhang (Huazhong University of Science and Technology); Jinhao Kuang (Huazhong University of Science and Technology); Li Yu (HUST)*

[P-ID 240] BVI-AOM: A New Training Dataset for Deep Video Compression Optimization

Jakub Nawała (Uniersity of Bristol)*; Yuxuan Jiang (University of Bristol); Fan Zhang (University of Bristol); Xiaoqing Zhu (Netflix); Joel Sole (Netflix); David Bull (University of bristol)

Poster Session 1

[15:30–17:30] Conference Room 2

Chair: João Ascenso (University of Lisbon)

[P-ID 024] Warm-start NeRF: Accelerating Per-scene Training of NeRF-based Light-Field Representation

Takuto Nishio (Nagoya University)*; Chihiro Tsutake (Nagoya University); Keita Takahashi (Nagoya University); Toshiaki Fujii (Nagoya Univ.)

[P-ID 016] Mono+Sub: Compressing Light Field as Monocular Image and Subsidiary Data

Ryosuke Imazu (Nagoya University)*; Chihiro Tsutake (Nagoya University); Keita Takahashi (Nagoya University); Toshiaki Fujii (Nagoya Univ.)

[P-ID 019] AdWeatherNet: Adverse Weather Denoising with Point Cloud Spatiotemporal Attention

Haozheng Han (Tsinghua University)*; Dongyu Du (Tsinghua University); Jie Luo (Tsinghua Shenzhen International Graduate School, Tsinghua University); Xin Jin (Tsinghua University)

[P-ID 030] Adaptive Block-Level Quality Parameter Adjustment Towards Low Video Bit-Rate Fluctuation

Longtao Feng (Peking University); Qian Yin (Peking University); Huiwen Ren (Peking University); Zhao Wang (Peking University)*; Siwei Ma (Peking University, China); Yuwen He (Bytedance Inc.)

[P-ID 063] Proposal-level Correction Guided by CLIP for Few-shot Object Detection

Ruihang Wang (University of Electronic Science and Technology of China)*; Taijin Zhao (University of Electronic Science and Technology of China); Hefei Mei (University of Electronic Science and Technology of China); Heqian Qiu (University of Electronic Science and Technology of China); Lanxiao Wang (University of Electronic Science and Technology of China); Hongliang Li (University of Electronic Science and Technology of China)

[P-ID 114] Convolutional neural networks estimate root-zone soil moisture from hyperspectral images

Lukasz Tulczyjew (Silesian University of Technology); Bogdan Ruszczak (Opole University of Technology)*; Michal Myller (Silesian University of Technology); Agata Maria Wijata (Silesian University of Technology); Dominika Boguszewska-Mańkowska (Plant Breeding and Acclimatization Institute); Jakub Nalepa (Silesian University of Technology)

[P-ID 018] Scenedoor: An Environmental Backdoor Attack for Face Recognition

Ruofei Wang (Hong Kong Baptist University)*; Ziyuan Luo (Hong Kong Baptist University); Haoliang Li (CityU); Renjie Wan (Hong Kong Baptist University)

[P-ID 065] IoU-CLIP: IoU-Aware Language-Image Model Tuning for Open Vocabulary Object Detection

Mingzhou He (University of Electronic Science and Technology of China); Qingbo Wu (University of Electronic Science and Technology of China)*; King Ngi Ngan (University of Electronic Science and Technology of China); Yiming Xiao (University of Electronic Science and Technology of China); Fanman Meng (University of Electronic Science and Technology of China); Heqian Qiu (University of Electronic Science and Technology of China); Hongliang Li (University of Electronic Science and Technology of China)

[P-ID 085] MGTN: Multi-scale Graph Transformer Network for 3D Point Cloud Semantic Segmentation

Da Ai (Xi’an University of Posts and Telecommunications); Siyu Qin (Xi'an University of Posts and Telecommunications)*; Zihe Nie (Xi’an University of Posts & Telecommunications); Hui Yuan (School of Control Science and Engineering, Shandong University); Ying Liu (Xi’an University of Posts & Telecommunication)

[P-ID 089] TeG: Temporal-Granularity Method for Anomaly Detection with Attention in Smart City Surveillance

Erkut Akdag (Eindhoven University of Technology)*; Egor Bondarev (TU Eindhoven); P. H. N. de With (Eindhoven University of Technology)

[P-ID 092] Development of GPU-based High-speed Frame Rate Convertor Software for International TV Program Material Exchange

Ryoichi Kawada (KDDI Research, Inc.)*; Manabu Iguchi (KDDI Corporation)

[P-ID 096] Differentiable Low-computation Global Correlation Loss for Monotonicity Evaluation in Quality Assessment

Yipeng Liu (Shanghai Jiao Tong University)*; Qi Yang (Tencent); Yiling Xu (Shanghai Jiao Tong University)

[P-ID 104] Learning-based Lossless Event Data Compression

Ahmadreza Sezavar (University of Lisbon); Catarina Brites (IST-IT); Joao Ascenso (IST-IT)*

[P-ID 093] Light field depth estimation based on fusion of multi-scale semantic and geometric information

Feng tan (Wuhan University of Science and Technology); Huiping Deng (WUST)*; Sen Xiang (Wuhan University of Science and Technology); Jin Wu (WUST)

[P-ID 029] Early Determination for Intra Block Copy Prediction with Refined Screen Content Detection

Zhenhao Sun (City University of Hong Kong); Meng Wang (City University of Hong Kong); Yingwen ZHANG (City University of Hong Kong); Shiqi Wang (City University of Hong Kong); Sam Kwong (Lingnan University)*

[P-ID 045] Hybrid Representation for 4D Medical Image Compression

Wuyang Zheng (Peking University)*; Jiarui Meng (Peking University); Jiaqi Zhang (Peking University); Jian Zhang (Peking University); Siwei Ma (Peking University, China)

[P-ID 084] Joint Local/Global Attention Cost Volume for Light Field Depth Estimation

Shiyu Fan (Wuhan University of Science and Technology); Huiping Deng (WUST)*; Sen Xiang (Wuhan University of Science and Technology); Jin Wu (WUST)

[P-ID 088] Handling Class Imbalance in Black-Box Unsupervised Domain Adaptation with Synthetic Minority Over-Sampling

Yawen Zou (University of Fukui); Chunzhi Gu (Toyohashi University of Technology); Zi Wang (Independent Researcher); Guang Li (Hokkaido University); Jun Yu (Niigata University); Chao Zhang (University of Toyama)*

[P-ID 094] Color Enhancement for V-PCC Compressed Point Cloud via 2D Attribute Map Optimization

Jingwei Bao (University of Electronic Sciences and Technology of China); Yu Liu (University of Electronic Science and Technology of China); Zeliang LI (Hong Kong Metropolitan University); Shuyuan Zhu (University of Electronic Science and Technology of China)*; Siu-Kei Au Yeung (Hong Kong Metropolitan University )

[P-ID 109] Bit Distribution Study and Implementation of Spatial Quality Map in the JPEG-AI Standardization

Panqi Jia (Huawei Munich Research Center && Friedrich-Alexander-Universität Erlangen-Nürnberg)*; Esin Koyuncu (Friedrich-Alexander-Universität Erlangen-Nürnberg); Jue Mao (Huawei technologies); Ahmet Burakhan Koyuncu (Huawei Technologies Duesseldorf GmbH); Timofey Solovyev (Huawei Technologies Duesseldorf GmbH); Alexander Karabutov (Huawei Technologies Duesseldorf GmbH); Yin Zhao (Nil); Elena Alshina (Huawei Technologies); André Kaup (Friedrich-Alexander-Universität Erlangen-Nürnberg)

[P-ID 025] Real-Time Video-based Point Cloud Compression (Demo)

Louis Fréneau (Tampere University); Guillaume Gautier (Tampere University)*; Heikki Tampio (Tampere University); Alexandre MERCAT (Tampere University); Jarno Vanne (Tampere University)

[P-ID 075] Real-Time Implementation of Neural-Network Post-Filters for 4K 60fps VVC Videos (Demo)

Daichi Arai (NHK)*; Shimpei Nemoto (NHK); Kazuhisa Iguchi (NHK); Atsuro Ichigaya (NHK)

Oral Session 5

[16:00–17:30] Masaru Ibuka Auditorium

"Visual Coding III"

Chair: Byeungwoo Jeon (Sungkyunkwan University)

[P-ID 023] A Fast Texture-Based 8K Intra-Partitioning Algorithm for Versatile Video Coding (VVC)

Altuğ Şimşek (Boğaziçi University)*; Günhan Dündar (Boğaziçi University)

[P-ID 176] Decoding Complexity-Rate-Quality Pareto-Front for Adaptive VVC Streaming

Angeliki Katsenou (University of Bristol); Vignesh V Menon (Fraunhofer HHI)*; Adam Wieckowski (HHI); Benjamin Bross (HHI); Detlev Marpe (HHI)

[P-ID 186] Fast Machine Learning Aided Intra Mode Decision for Real-Time VVC Intra Coding

Joose Sainio (Tampere University)*; Baran Ataman (Tampere University); Alban Marie (INSA Rennes); Alexandre MERCAT (Tampere University); Jarno Vanne (Tampere University)

[P-ID 202] Energy-Quality-aware Variable Framerate Pareto-Front for Adaptive Video Streaming

Prajit T Rajendran (Université Paris-Saclay); Samira Afzal (Alpen-Adria-Universitat Klagenfurt); Vignesh V Menon (Fraunhofer HHI)*; Christian Timmerer (Alpen-Adria-Universität Klagenfurt)

[P-ID 249] Variable Bitrate Models For Learned Image Compression with Multi-gain units and Weighted Probability Assignment

RAN WANG (WASEDA UNIVERSITY)*; WEN JIANG (WASEDA UNIVERSITY); Heming Sun (Yokohama National University); Jiro Katto (Waseda University)

Oral Session 6

[16:00–17:30] Conference Room 1

"Security/Privacy"

Chair: Keita Takahashi (Nagoya University)

[P-ID 119] Enhancing Privacy-Utility Tradeoff with Few-Round Strategy in Heterogeneous Federated Learning

Qingbin Wei (Harbin Institute of Technology)*; Feilong zhang (Harbin Institute of Technology); Yuanchao Bai (Harbin Institute of Technology); Deming Zhai (Harbin Institute of Technolgy); Junjun Jiang (Harbin Institute of Technology); Xianming Liu (Harbin Institute of Technology)

[P-ID 216] A Novel Reversible Data Hiding Scheme in Compressible Encrypted Grayscale-Based Images

RUIFENG LI (Tokyo Metropolitan University)*; Masaaki Fujiyoshi (Tokyo Metropolitan University)

[P-ID 081] Federated Contrastive Domain Adaptation for Category-inconsistent Object Detection

Wei-Yu Chen (National Yang Ming Chiao Tung University); Peggy Lu (National Chung Cheng University)*; Vincent S. Tseng (National Yang Ming Chiao Tung University)

[P-ID 260] READFake: Reflection and Environment-Aware DeepFake Detection

Muhammad Mohzary (Jazan University); Elham Basunduwah (UMKC); Sejun Song (Augusta University)*; BaekYoung Choi (University of Missouri Kansas City (UMKC))

[P-ID 178] FRIDAY: Mitigating Unintentional Facial Identity in Deepfake Detectors Guided by Facial Recognizers

Younghun Kim (KAIST)*; Myung-Joon Kwon (KAIST); Wonjun Lee (KAIST); Changick Kim (KAIST)

Tuesday, December 10, 2024 (Day 3)

Keynote 3

[9:00–10:00] Masaru Ibuka Auditorium

"Photorealistic Avatars for Video Conferencing"

Dr. Ross Cutler (Microsoft)

Chair: Gary Sullivan (Dolby Labs)

VSPC Rising Star Session

[10:30–12:00] Masaru Ibuka Auditorium

Chair: Prof. Zhu Li (University of Missouri)

Finalists (alphabetical order by last name):

Xin JIN (Eastern Institute of Technology in Ningbo, China)
Jun LIU (Lancaster University, UK)
Wei ZHOU (Cardiff University, UK)

Oral Session 7

[13:30–15:00] Masaru Ibuka Auditorium

"SS-3: Recent Advancements in Versatile Supplemental Enhancement Information (VSEI)"

Chair: Jill Boyce (Nokia), Teruhiko Suzuki (Sony)

[P-ID 196] Signaling of object masks with the assistance of the object mask information SEI message

Jie Chen (Alibaba)*; Zixiang Zhang (Alibaba); Yan Ye (Alibaba Inc.); Shurun Wang (Alibaba Group)

[P-ID 205] The source picture timing SEI message in the VSEI standard

Sean McCarthy (Dolby)*; Gary J. Sullivan (Dolby); Peng Yin (Dolby)

[P-ID 077] Film Grain Regions characteristics SEI message

Edouard Francois (InterDigital)*; Philippe de Lagrange (InterDigital); Franck Galpin (InterDigital); Gilles Teniou (Tencent); Stephan Wenger (Tencent)

[P-ID 074] Encoder Optimization Information SEI Message for Identifying Optimization Objectives and Methods

ChulKeun Kim (LG electronics)*; Hendry Tan (LG electronics); Jaehyun Lim (LG electronics); Seung-Hwan Kim (LG Electronics)

[P-ID 225] Packed Regions Information SEI Message

Jill Boyce (Nokia)*; Miska Hannuksela (Nokia Technologies); Honglei Zhang (Nokia Technologies); Antti Hallapuro (Nokia)

Oral Session 8

[13:30–15:00] Conference Room 1

"Application"

Chair: Jiro Katto (Waseda University)

[P-ID 044] SketchAnimator: Animate Sketch via Motion Customization of Text-to-Video Diffusion Models (Best Paper Candidate)

Ruolin Yang (Beijing University of Posts and Telecommunications)*; Da Li (Samsung); Honggang Zhang (Beijing University of Posts and Telecommunications); Yi-Zhe Song (University of Surrey)

[P-ID 134] LLaVA-Tour: A Large Multimodal Model for Japanese Tourist Spot Prediction and Review Generation (Best Paper Candidate)

Hiromasa Yamanishi (The University of Tokyo); Ling Xiao (The university of Tokyo)*; Toshihiko Yamasaki (The University of Tokyo)

[P-ID 182] Quadrature Color Vibration Method for Improving Robustness of Imperceptible Markers Embedded in Video

Yuta Kibayashi (The University of Tokyo)*; Kota Araki (The University of Tokyo); Yasunori Akashi (The University of Tokyo); Changyo Han (The University of Tokyo); Takeshi Naemura (The University of Tokyo)

[P-ID 042] Towards Validating Face Editing Ability in Generative Models

Dai-Jie Wu (Academia Sinica); Pin-Yen Chiu (Academia Sinica); Chih-Yu Wang (Academia Sinica); Jun-Cheng Chen (Academia Sinica)*

[P-ID 261] Table Tennis Stroke Classification from Game Videos Using 3D Human Keypoints

Yuta Fujihara (Ritsumeikan University)*; Xiangbo Kong (Toyama Prefectural University); Ami Tanaka (Ritsumeikan University); Hiroki Nishikawa (Osaka University); Hiroyuki Tomiyama (Ritsumeikan University)

Poster Session 2

[15:00–17:00] Conference Room 2

Chair: Seishi Takamura (Hosei University)

[P-ID 157] Joint-Neighborhood Product Quantization for Unsupervised Cross-Modal Retrieval

Runhao Li (Nanyang Technological University)*; zhenyu weng (nanyang technological university); Yongming Chen (Nanyang Technological University); Huiping Zhuang (South China University of Technology); Yap-Peng Tan (Nanyang Technological University, Singapore); Zhiping Lin (Nanyang Technological University)

[P-ID 127] MVBIND: Self-Supervised Music Recommendation For Videos Via Embedding Space Binding

Jiajie Teng (Shanghai Jiao Tong University)*; Huiyu Duan (Shanghai Jiao Tong University); Yucheng Zhu (Shanghai Jiao Tong University); Sijing Wu (Shanghai Jiao Tong University); Guangtao Zhai (Shanghai Jiao Tong University)

[P-ID 166] Spatial Similarity-Based Fast Mode Decision for VVC Chroma Intra Coding

Haihang Wang (School of Electrical and Information Engineering, Tianjin University)*; Feng Yuan (School of Electrical and Information Engineering, Tianjin University); Liqian Zhang (School of Electrical and Information Engineering, Tianjin University); Jixing Chen (School of Electrical and Information Engineering, Tianjin University); Fu Lee Wang (Hong Kong Metropolitan University); Zhaoqing Pan (School of Electrical and Information Engineering, Tianjin University)

[P-ID 193] Uniformly Accelerated Motion Model for Inter Prediction

Zhuoyuan Li (University of Science and Technology of China); Yao Li (University of Science and Technology of China); Chuanbo Tang (University of Science and Technology of China); Li Li (University of Science and Technology of China); Dong Liu (University of Science and Technology of China); Feng Wu (University of Science and Technology of China)*

[P-ID 201] PointCU: Multiscale Sparse Convolutional Learning for Point Cloud Color Upsampling

Birendra Kathariya (University of Missouri-kansas City)*; Anique Akhtar (Qualcomm); Zhu Li (university of missouri-kansas city); Geert Van der Aweera

[P-ID 136] End-to-end Prediction of Streaming Video Quality of Experience: Dataset and Approach

Ziheng Jia (Institute of Image Communication and Network Engineering, Shanghai Jiao Tong University)*; Xiongkuo Min (Shanghai Jiao Tong University); Guangtao Zhai (Shanghai Jiao Tong University)

[P-ID 141] Deviation Control for Learned Image Compression

Yuqi Li (Unversity of Science and Technology of China); Haotian Zhang (Unversity of Science and Technology of China); Xiaomin Song (Sichuan Xinshi Chuangwei Ultra HD Technology Co., Ltd); Zheng Liu (Sichuan Xinshi Chuangwei Ultra HD Technology Co., Ltd); Huiming Zheng ( Sichuan Xinshi Chuangwei Ultra HD Technology Co., Ltd); Li Li (University of Science and Technology of China); Dong Liu (University of Science and Technology of China)*

[P-ID 149] Learned Image Compression with Quantization Error Compensator

Nianxiang Fu (Wuhan University); Zhenzhong Chen (Wuhan University)*; Huairui Wang (Wuhan University); Shan Liu (Tencent America)

[P-ID 159] Advanced Learning-Based Inter Prediction for Future Video Coding

Yanchen Zhao (Peking University)*; Wenhong Duan (Shanghai Jiao Tong University); Chuanmin Jia (Peking University); Shanshe Wang (Peking University); Siwei Ma (Peking University, China)

[P-ID 162] ACIQA: A Dataset and Method for Assessing the Imaging Quality of Automotive Cameras

Yijie Huang (Shanghai University of Electric Power)*; Haoyang Ni (Shanghai University of Electric Power); Kaiwei Zhang (Shanghai Jiao Tong University); Ziheng Jia (Institute of Image Communication and Network Engineering, Shanghai Jiao Tong University); Fangfang Lu (Shanghai University of Electric Power); Xiongkuo Min (Shanghai Jiao Tong University); Guangtao Zhai (Shanghai Jiao Tong University)

[P-ID 169] Inter Submesh Border Information Coding with Skip Mode in V-DMC

Koki Kishimoto (KDDI Research)*; Kei Kawamura (KDDI Research); Haruhisa Kato (KDDI Research Inc.)

[P-ID 170] A High-Efficiency and Low-Complexity SKIP Type for Base Mesh Coding in V-DMC

Jianfeng Xu (KDDI Research, Inc.)*; Haruhisa Kato (KDDI Research, Inc.); Kei Kawamura (KDDI Research)

[P-ID 171] Active Learning through Integration of Informativeness and Diversity for Monocular 3D Object Detection

HYUNWOOK JEONG (HYUNDAI MOBIS)*; Gyuseok Oh (Hyundai Mobis)

[P-ID 179] AsymLLIC: Asymmetric Lightweight Learned Image Compression

Shen Wang (Shanghai Jiao Tong University); Zhengxue Cheng (Shanghai Jiao Tong University)*; Donghui Feng (Cooperative Medianet Innovation Center, Shanghai, China); Guo Lu (Shanghai Jiao Tong University); Li Song (Shanghai Jiao Tong University); Wenjun Zhang (Shanghai Jiao Tong University)

[P-ID 203] Deep Reference Frame for Versatile Video Coding with Structural Re-parameterization

Chengzhuo Gui (Wuhan University); yuantong Zhang (wuhan university); Weijie Bao (WHU); Zhenzhong Chen (Wuhan University)*; Huairui Wang (Wuhan University); Shan Liu (Tencent America)

[P-ID 116] DDIN: Enhancing Food Ingredient Recognition with Region and Category Discovery Modules

Yiheng Ru (Tianjin University)*; Huaiyan Jiang (Tianjin University); Hang Song (Tokyo Institute of Technology); Bo Wei (The University of Tokyo); YU LIU (Tianjin University, Tianjin 300072, China)

[P-ID 117] Semantic Ensemble Loss and Latent Refinement for High-Fidelity Neural Image Compression

Daxin Li (Harbin Institute of Technology)*; Yuanchao Bai (Harbin Institute of Technology); Kai Wang (Harbin Institute of Technology); Junjun Jiang (Harbin Institute of Technology); Xianming Liu (Harbin Institute of Technology)

[P-ID 137] Frame Level Content Adaptive λ for Neural Video Compression

Zhirui Zuo (University of Science and Technology of China ); Junqi Liao (University of Science and Technology of China); Xiaomin Song (Sichuan Xinshi Chuangwei Ultra HD Technology Co., Ltd); Zheng Liu (Sichuan Xinshi Chuangwei Ultra HD Technology Co., Ltd); Huiming Zheng (Sichuan Xinshi Chuangwei Ultra HD Technology Co., Ltd); Dong Liu (University of Science and Technology of China)*

[P-ID 140] Low-Rate Feature Compression for Humans and Machines with Dual Aggregation Attention

Ruixi Ma (Shanghai University); Ping An (Shanghai University)*; Shipei Wang (Shanghai University); Xinpeng Huang (Shanghai University); Chao Yang (Shanghai University)

[P-ID 198] ALICE: Adapt your Learnable Image Compression modEl for variable bitrates

Gabriele Spadaro (University of Torino)*; Muhammad Salman Ali (Kyung Hee University); Alberto Presta (University of Turin); Giommaria Pilo (Télécom Paris - Institut Polytechnique de Paris); Sung-Ho Bae (Kyung Hee University); Jhony H. Giraldo (Télécom Paris, Institut Polytechnique de Paris); Attilio Fiandrotti (Università di Torino); Marco Grangetto (University of Torino); Enzo Tartaglione (Télécom Paris - Institut Polytechnique de Paris)

[P-ID 256] Keep the Key Part: Exploring Drone-Captured Digital Elevation Model Data Augmentation for Deep Learning-based Crop Height Estimation

Jinjin Wang (School of Engineering and Informatics, University of Sussex)*; Nobuyuki Oishi (University of Sussex); Renhui Ying (School of Engineering and Informatics, University of Sussex); Guiyi Wei (Zhejiang Gongshang University); Phil Birch (School of Engineering and Informatics, University of Sussex); Bao Kha Nguyen (School of Engineering and Informatics, University of Sussex)

Oral Session 9

[15:30–17:00] Masaru Ibuka Auditorium

"Visual Coding IV"

Chair: Chuanmin Jia (Peking University)

[P-ID 043] Parallelized Nonlinear Scaled Transform for HEVC

Pierre-Alain Afro (Allegro DVT / Gipsa Lab)*; Loic Strus (Allegro DVT); Hugo Chauvet (Allegro DVT); Laurent Bonnaud (GIPSA); Alice CAPLIER (Grenoble, France); Frederic ROBIN (Allegro DVT)

[P-ID 132] In-Loop Filtering via Trained Look-Up Tables

Zhuoyuan Li (University of Science and Technology of China); Jiacheng Li (University of Science and Technology of China); Yao Li (University of Science and Technology of China); Li Li (University of Science and Technology of China); Dong Liu (University of Science and Technology of China)*; Feng Wu (University of Science and Technology of China)

[P-ID 175] Learned Lossless Coding for Ultra-high-speed Spike Streams via Intensity Remapping

Fanke Dong (Peking University)*; Chuanmin Jia (Peking University)

[P-ID 215] Multi-stage Attention Network with Auxiliary Information Refinement for VVC In-loop Filtering

Xin-Yi Cui (School of Electronics and Information Technology, Sun Yat-Sen University)*; Zhidao Zhou (Sun Yat-Sen University); Zhikai Liu (Sun Yat-sen University); Li Chen (School of Electronics and Information Technology, Sun Yat-Sen University); Fan Liang (Sun Yat-sen University)

[P-ID 082] Enhancing Global Tetris Packing in V-PCC Through Dynamic Group Partitioning

Yun-Chang Tsai (National Chung Cheng University); Jui-Chiu Chiang (National Chung Cheng University)*

Oral Session 10

[15:30–17:00] Conference Room 1

"Point Cloud "

Chair: Toshiaki Fujii (Nagoya University)

[P-ID 220] CRC-DPCGC: Conditional Residual Coding for Dynamic Point Cloud Geometry Compression (Best Paper Candidate)

BingHan Wu (CCU); Monyneath Yim (National Chung Cheng University); Jui-Chiu Chiang (National Chung Cheng University)*

[P-ID 048] Sample Adaptive Offset for Geometry-based Point Cloud Attribute Compression

lizhi hou (Shanghai Jiao Tong University)*; Qian Zhang (Shanghai Jiao Tong University); Yiling Xu (Shanghai Jiao Tong University)

[P-ID 177] Memory-Efficient Point Cloud Registration via Overlapping Region Sampling

Tomoyasu Shimada (NTT Corporation)*; Kazuhiko Murasaki (NTT Corporation); Shogo Sato (NTT); Toshihiko Nishimura (NTT Corporation); Taiga Yoshida (NTT Corporation); Ryuichi Tanida (NTT Corporation)

[P-ID 073] No-Reference Point Cloud Quality Assessment with Adaptive Keyframe Selection

Haomiao Wang (Beijing Technology and Business University)*; Xiaochuan Wang (Beijing Technology and Business University); Xianpeng Yuan (Beijing Technology and Business University); Xiaoming Chen (School of Computer Science and Engineering, Beijing Technology and Business University); Haisheng LI (Beijing Technology and Business University)

[P-ID 211] Analysis of Relationship between Point Cloud Just Noticeable Difference and Attribute Quantization Parameters

zhang chen (Northwestern Polytechnical University); luqian bai (Northwestern Polytechnical University); Mengting Yu (Northwestern Polytechnical University); Shuai Wan (Northwestern Polytechnical University)*; hejie Yang (Xidian University)

Wednesday December 11, 2024 (Day 4)

Keynote 4

[9:00–10:00] Masaru Ibuka Auditorium

"AI Coding Reality and Perspectives"

Dr. Elena Alshina

Chair: Lu Yu (Zhejiang University)

Oral Session 11

[10:30–12:00] Masaru Ibuka Auditorium

"SS-4: Implicit and Explicit Neural Representations for nD Video Compression"

Chair: Yiyi Liao (Zhejiang University)

[P-ID 219] PET-NeRV: Bridging Generalized Video Codec and Content-Specific Neural Representation

Hao Li (Zhejiang Univerisity); Lu Yu (Zhejiang University); Yiyi Liao (Zhejiang University)*

[P-ID 274] A Practical Approach to Depth-Aware Augmentation for Neural Radiance Fields

Hamed Razavi Khosroshahi (Université libre de Bruxelles (ULB))*; Jaime Sancho (Universidad Politécnica de Madrid); Daniele Bonatto (Université Libre de Bruxelles); Sarah Fachada (Université Libre de Bruxelles); Gun Bang (ETRI); Gauthier Lafruit (ULB-LISA); Eduardo Juarez (Universidad Politécnica de Madrid); Mehrdad Teratani (Université Libre de Bruxelles)

[P-ID 168] Dynamic Volumetric Video Coding with Tensor Decomposition

Juyeon Shin (Ewha W University); Yeoneui Kim (Ewha Womans University); Gun Bang (ETRI); Jewon Kang (Ewha Womans University)*

[P-ID 292] Compressing 3D Gaussian Splatting via a Generalizable Neural Coder

Junteng Zhang (Nanjing University)*; Tong Chen (Nanjing University); Hao Zhu (Nanjing University); Dong Wang (Guangdong OPPO Mobile Telecommunications Corp., Ltd. ); Dandan Ding (Hangzhou Normal University); Zhan Ma (Nanjing University)

Oral Session 12

[10:30–12:00] Conference Room 1

"Understanding/Recognition/Detection"

Chair: Jiro Katto (Waseda University)

[P-ID 013] IRAD: Input-Reference Joint Driven Reconstruction for Unified Anomaly Detection

Zixin Chen (Shanghai Jiaotong University)*; Xincheng Yao (Shanghai Jiao Tong University); Yan Luo (Shanghai Jiao Tong University); Baozhu Zhang (Ningbo Haitang Information Technology Co., Ltd); Zhenyu Liu (Ningbo Haitang Information Technology Co., Ltd.); Chongyang Zhang (Shanghai Jiao Tong University)

[P-ID 246] Generative Representation and Discriminative Classification for Few-shot Open-set Object Detection

Peixue Shen (Shanghai Jiao Tong University); Ruoqi Li (SJTU); Yan Luo (Shanghai Jiao Tong University); Yiru Zhao (Shanghai Jiao Tong University); Chao Gao (China Pacific Insurance (Group) Co., Ltd.); Chongyang Zhang (Shanghai Jiao Tong University)*

[P-ID 146] Fully Aligned Network for Referring Image Segmentation

Yong Liu (Tsinghua University)*; Ruihao Xu (Tsinghua University); Yansong Tang (Tsinghua University)

[P-ID 034] Localization-Aware Multi-Scale Representation Learning for Repetitive Action Counting

Sujia Wang (Tsinghua University)*; Xiangwei Shen (Tsinghua University); Yansong Tang (Tsinghua University); Xin Dong (Tsinghua University); Wenjia Geng (Shenzhen International Graduate School，Tsinghua University); Lei Chen (Tsinghua University)

[P-ID 259] Performance Evaluation of Feature Detectors and Descriptors with Close-Range Solar Panel Images

Eman Ansar (Carnegie Mellon University in Qatar); Sara Zewil (Carnegie Mellon University in Qatar); Fathimath Zuha Maksood (Carnegie Mellon University in Qatar ); Eduardo Marcelo Feo Flushing (Carnegie Mellon University in Qatar)*

Oral Session 13

[13:30–15:00] Masaru Ibuka Auditorium

"SS-5: Emerging Trends in Learning-based Image/Video Coding and Perceptual Quality Assessment"

Chair: Yiyi Liao (Zhejiang University)

[P-ID 069] NeRV++: An Enhanced Implicit Neural Video Representation

Ahmed Ghorbel (Ecole polytechnique)*; Wassim Hamidouche (INSA Rennes); Luce Morin (INSA Rennes)

[P-ID 271] Improving Reconstruction Fidelity in Generative Face Video Coding using High Frequency Shuttling

Goluck Konuko (L2S - CentraleSupélec, Université Paris Saclay)*; Giuseppe Valenzise (CNRS, CentraleSupelec); Anthony TRIOUX (Xidian University, School of Telecommunications Engineering, Xi'an China)

[P-ID 273] Characterizing the geometric complexity of G-PCC compressed point clouds

Annalisa Gallina (Università degli Studi di Padova); Hadi Amirpour (University of Klagenfurt); Sara Baldoni (University of Padova)*; Giuseppe Valenzise (CNRS); Federica Battisti (University of Padova)

[P-ID 049] ReLI-QA: A Multidimensional Quality Assessment Dataset for Relighted Human Heads

Yingjie Zhou (Shanghai Jiao Tong University)*; Zicheng Zhang (Shanghai Jiaotong university); Farong Wen (Shanghai Jiaotong university); Jun Jia (Shanghai Jiao Tong University); Xiongkuo Min (Shanghai Jiao Tong University); Jia Wang (Shanghai Jiao Tong University); Guangtao Zhai (Shanghai Jiao Tong University)

[P-ID 187] Quantizing Neural Networks with Knowledge Distillation for Efficient Video Quality Assessment (Best Paper Candidate)

Jiayuan Yu (Zhejiang University); Yingming Li (Zhejiang University)*

Oral Session 14

[13:30–15:00] Conference Room 1

"Visual Processing/Enhancement/Restoration"

Chair: Xin Jin (Shenzhen International Graduate School, Tsinghua University)

[P-ID 167] Frame Similarity-Based Screen Content Video Quality Enhancement via Adaptive Long Short-Term Fusion

Ziyin HUANG (The Hong Kong Polytechnic University); Yui-Lam Chan ( The Hong Kong Polytechnic University )*; Ngai-Wing Kwong (The Hong Kong Polytechnic University); Sik-Ho Tsang (The Hong Kong Polytechnic University); Kin-Man Lam (The Hong Kong Polytechnic University); Bingo Wing Kuen Ling (Guangdong University of Technology)

[P-ID 014] FSDN: Image frequency and semantic decomposition network for image dehazing

Zongyang Tong (Tsinghua University); Mingyu Liu (Tsinghua University); Xin Jin (Tsinghua University)*

[P-ID 165] Cross-Device Image Saliency Detection: Database and Comparative Analysis

Xiaoying Ding (Zhongnan University of Economics and Law); Guanghui Yue (Shenzhen university); Yingxue Zhang (Tianjin University of Science and Technology)*

[P-ID 180] Lookup Register-Tables with Interpolation for Effective Image Transformation on x86/64 CPUs

Hirokazu Kamei (Nagoya Institute of Technology); Soichiro Honda (Nagoya Institute of Technology); Kohei Hayashi (Nagoya Institute of Technology); Yoshihiro Maeda (Shibaura Institute of Technology); Norishige Fukushima (Nagoya Institute of Technology)*

[P-ID 181] Motion Estimation for Quanta Image Sensors Using Spatio-Temporal Priors

Hiroya Fukawa (Tokyo University of Science)*; Kosuke Kurihara (Tokyo university of science); Yoshihiro Maeda (Shibaura Institute of Technology); Shunichi Sato (Tokyo University of Science); Takayuki Hamamoto (Tokyo University of Science)

Poster Session 3

[15:00–17:00] Conference Room 2

Chair: Jui-Chiu Rachel Chiang (National Chung Cheng University)

[P-ID 204] Anchoring Vision and Language Knowledge for Weakly Supervised Group Activity Recognition

Muhammad Adi Nugroho (KAIST)*; Jinyoung Park (KAIST); Donguk Kim (KAIST); Changick Kim (KAIST)

[P-ID 277] Pseudo Dataset Generation for Out-of-domain Multi-Camera View Recommendation

Kuan-Ying Lee (University of Illinois at Urbana-Champaign)*; Qian Zhou (University of Illinois at Urbana-Champaign); Klara Nahrstedt (University of Illinois at Urbana-Champaign)

[P-ID 207] Deep Reinforcement Learning-Based Camera Autofocus with Gaussian Process Regression

Li Wei (Shanghai Jiao Tong University)*; Yuankun Jiang (Shanghai Jiao Tong University); Chenglin Li (Shanghai Jiao Tong University); Wenrui Dai (Shanghai Jiao Tong University); Junni Zou (Shanghai Jiao Tong University); Hongkai Xiong (Shanghai Jiao Tong University)

[P-ID 288] High-Fidelity Image Style Transfer by Hybrid Transformers

Zhe-Wei Hsu (National Taipei University of Technology ); Shih-Hsuan Yang (National Taipei University of Technology)*; Bo-Jiun Tung (National Taipei University of Technology)

[P-ID 214] PFT-ILF: In-loop Filter with Partition Feature Transform for Versatile Video Coding

Xin-Yi Cui (School of Electronics and Information Technology, Sun Yat-Sen University)*; Zhikai Liu (Sun Yat-sen University); Zhidao Zhou (Sun Yat-Sen University); Li Chen (School of Electronics and Information Technology, Sun Yat-Sen University); Fan Liang (Sun Yat-sen University)

[P-ID 242] Image Forensics Strikes Back: Defense Against Adversarial Patch

Ching-Chia Kao (National Taiwan University; Academia Sinica); Chun-Shien Lu (Academia Sinica)*; Chia-Mu Yu (National Yang Ming Chiao Tung University)

[P-ID 248] Lightweight Arbitrary-Scale Super-Resolution of Remote Sensing Images via Super-Scale Feature

Yifei Long (Wuhan University); yuantong Zhang (wuhan university); Daiqin Yang (Wuhan University); Zhenzhong Chen (Wuhan University)*; Huairui Wang (Wuhan University); Shan Liu (Tencent America)

[P-ID 251] Predicting total time to compress a video corpus using online inference systems

Xin Shu (Trinity College Dublin)*; Vibhoothi Vibhoothi (Trinity College Dublin); Anil Kokaram (Trinity College Dublin, Ireland)

[P-ID 253] UplinkNet: Practical Commercial 5G Standalone (SA) Uplink Throughput Prediction

Kasidis Arunruangsirilert (Waseda University)*; Jiro Katto (Waseda University)

[P-ID 254] MAESR360: Masked autoencoder-based 360-degree video streaming via multi-scale feature fusion

Li Yu (Nanjing University of Information Science and Technology)*; Zhiyu Pang (Nanjing University of Information Science and Technology); Moncef Gabbouj (Tampere University)

[P-ID 255] Lightweight Stochastic Video Prediction via Hybrid Warping

Kazuki Kotoyori (Waseda University)*; Shota Hirose (Waseda University); Heming Sun (Yokohama National University); Jiro Katto (Waseda University)

[P-ID 266] Energy-Efficient Video Streaming: A Study on Bit Depth and Color Subsampling

Hadi Amirpour (University of Klagenfurt)*; Lingfeng Qu (SWJTU); Jong Hwan Ko (Sungkyunkwan University); Cosmin Stejerean (Meta); Christian Timmerer (Alpen-Adria-Universität Klagenfurt)

[P-ID 279] Fast Retrieval of Pharmaceutical Packaging Images Using Keypoint Matching with Angle and Scale Voting for Outlier Rejection

Yona Zakaria (Nara Institute of Science and Technology)*; Rui Ishiyama (NEC); Eiki Ishidera (NEC); Tomokazu Matsui (Nara Institute of Science and Technology ); Keiichi Yasumoto (Nara Institute of Science and Technology, Japan)

[P-ID 217] Adaptive Hint Propagation for Iterative Stereo Matching

Anning Hu (Shanghai Jiao Tong University)*; Ang Li (Shanghai Jiao Tong University); Danping Zou (Shang Jiao Tong University)

[P-ID 224] AgeSynthGAN: Advanced Facial Age Synthesis with StyleGAN2

Tung-Ke Hsieh (National Chung Hsing University); Tsung-Jung Liu (National Chung Hsing University)*; Kuan-Hsien Liu (National Taichung University of Science and Technology)

[P-ID 241] LIGHTWEIGHT GRAPH CONVOLUTIONAL NETWORK BASED ON MULTI-HEAD RESIDUAL ATTENTION FOR HAND POINT CLASSIFICATION

Duc-Chinh Nguyen (International School, Vietnam National University); Manh-Hung Ha (International School, Vietnam National University)*; Manh-Tuan Do (International School, Vietnam National University); Oscal T.-C. Chen (National Chung Cheng University)

[P-ID 245] KonIQ-10k-LT: Overcoming Score Priors in Blind Image Quality Assessment Under Imbalanced Distributions

Desen Yuan (UESTC)*; Lei Wang (University of Electronic Science and Technology of China)

[P-ID 263] MSCFormer: Multi-Scale Circular Transformer for Image Deblurring

Shuai Wang (School of Microelectronics, Tianjin University)*; Han Wang (School of Microelectronics, Tianjin University); Renhe Liu ( School of Microelectronics, Tianjin University); Zhipeng Wu (School of Microelectronics, Tianjin University); Bo Wei (School of Engineering, The University of Tokyo); YU LIU (Tianjin University, Tianjin 300072, China)

[P-ID 280] LMM-driven Semantic Image-Text Coding for Ultra Low-bitrate Learned Image Compression

Shimon Murai (Waseda University)*; Heming Sun (Yokohama National University); Jiro Katto (Waseda University)

Oral Session 15

[15:30–17:00] Masaru Ibuka Auditorium

"3D"

Chair: Jianfeng Xu (KDDI Research, Inc.)

[P-ID 038] Adaptive Threshold Mask Prediction and Occlusion-aware Convolution for Foreground Occlusions in Light Fields

Jieyu Chen (Shanghai Universiy); Ping An (Shanghai University)*; Xinpeng Huang (Shanghai University); Chao Yang (Shanghai University)

[P-ID 229] Mirror-3DGS: Incorporating Mirror Reflections into 3D Gaussian Splatting

Jiarui Meng (Peking University)*; Haijie LI (Peking University); Yanmin Wu (Peking University); Qiankun Gao (Peking University Shenzhen Graduate School); Shuzhou Yang (Peking University); Jian Zhang (Peking University); Siwei Ma (Peking University, China)

[P-ID 070] Coarse-to-fine Transformer For Lossless 3D Medical Image Compression

Yang Xiaoxuan (Shanghai Jiao Tong University); Guo Lu (Shanghai Jiao Tong University)*; Donghui Feng (Cooperative Medianet Innovation Center, Shanghai, China); Zhengxue Cheng (Shanghai Jiao Tong University); Guosheng Yu (T-Head Semiconductor Co., Ltd, Alibaba Group); Li Song (Shanghai Jiao Tong University)

[P-ID 283] Efficient Camera Pose Adjustment to a Mirror Array for Structured Light Field Video Acquisition

Shunsuke Maeda (Tokyo University of Science)*; Kazuya KODAMA (Research Organization of Information and Systems); Takayuki Hamamoto (Tokyo University of Science)

[P-ID 099] Explicit-NeRF-QA: A Quality Assessment Database for Explicit NeRF Model Compression

Yuke Xing (Shanghai Jiao Tong University)*; Qi Yang (Tencent); Kaifa Yang (Shanghai Jiao Tong University); Yiling Xu (Shanghai Jiao Tong University); Zhu Li (university of missouri-kansas city)

Oral Session 16

[15:30–17:00] Conference Room 1

"Quality Assessment"

Chair: Yasuko Sugito (NHK)

[P-ID 103] Benchmarking Conventional and Learned Video Codecs with a Low-Delay Configuration

Siyue Teng (University of Bristol)*; Yuxuan Jiang (University of Bristol); Ge Gao (University of Bristol); Fan Zhang (University of Bristol); Thomas J Davies (Visionular); Zoe Liu (Visionular Inc); David Bull (University of bristol)

[P-ID 212] Image-Prompt Integration Network with Self-Ranking and Inter-Ranking Loss for AI-Generated Image Quality Assessment

Xizhang Yao (Shenzhen University)*; Tianwei Zhou (Shenzhen University); Guanghui Yue (Shenzhen university); songbai Tan (Shenzhen University); Xiaoying Ding (Zhongnan University of Economics and Law)

[P-ID 108] Perceptual Skin Tone Color Difference Measurement for Portrait Photography

Shiqi Gao (Shanghai Jiao Tong University)*; Huiyu Duan (Shanghai Jiao Tong University); Qihang Xu (Transsion); Jia Wang (Shanghai Jiao Tong University); Xiongkuo Min (Shanghai Jiao Tong University); Guangtao Zhai (Shanghai Jiao Tong University); Patrick Le Callet (Universite de Nantes, France)

[P-ID 223] Multi-Screen Effects on Quality Assessment: Investigating Banding Metrics Inconsistencies

Nickolay I Safonov (MSU)*; Dmitriy S Vatolin (Lomonosov Moscow State University); Dmitriy Kulikov (Lomonosov Moscow State University, Dubna University )

[P-ID 232] Judder Modelling Framework with Perceptual Quality Score Prediction for HDR Videos

Hongjie You (Technical University of Munich)*; Zhendong Li (TUM); Nicola Giuliani (TU Munich); Atanas Boev (Huawei Technologies Duesseldorf GmbH); Elena Alshina (Huawei Technologies); Eckehard Steinbach (TUM)

Technical Program

(Tentative)

Sunday, December 8, 2024 (Day 1)

Tutorial 1

Tutorial 2

Tutorial 3

Tutorial 4

Monday, December 9, 2024 (Day 2)

Keynote 1

Oral Session 1

Oral Session 2

Keynote 2

Oral Session 3

Oral Session 4

Poster Session 1

Oral Session 5

Oral Session 6

Tuesday, December 10, 2024 (Day 3)

Keynote 3

VSPC Rising Star Session

Oral Session 7

Oral Session 8

Poster Session 2

Oral Session 9

Oral Session 10

Wednesday December 11, 2024 (Day 4)

Keynote 4

Oral Session 11

Oral Session 12

Oral Session 13

Oral Session 14

Poster Session 3

Oral Session 15

Oral Session 16