Может надо не с камеры звук? А например с кассетного магнитофона, или с микрофона? и все это одновременно с захватом? тоже интересно зачем.
Как-то видел передачу, где камера снимала интервью, но с очень большого расстояния, порядка 50 метров. По замыслу авторов это видимо было очень круто, т.к. камера за время интервью (где-то 20-40 секунд) раз пять "отъезжала-наезжала", чтоб показать из какой дали все это снимается.
Так вот, наверное и здесь что-то подобное - тянуть микрофонный кабель от камеры на такое расстояние нет смысла, проще с собой магнитофон унести. Или съемка скрытой камерой с записью звука на диктофон у снимаемого объекта... Да мало ли причин.
По поводу вопроса. Мне кажется, что нужно захватывать звук и видео отдельно, а потом в монтажке их склеить - это будет проще всего.