GitHub

需求概述

用户可从chromebook，PC端的chrome浏览器登录虚拟机
可以控制虚拟机的开机，关机，重启，断电，登录等操作
可从web端登录虚拟机，提供不低于终端的操作体验（音视频播放流畅，同步，交互延时低等）
支持快捷键操作
性能需求：Chromebook，PC等常见的移动终端设备能较轻松流畅的操作虚拟机，播放音视频等。

条件与限制

不支持USB重定向
不支持视频重定向
不支持广播
不支持双屏
目前只支持windows平台和chromebook平台的chrome浏览器
不支持VDX协议

系统详细设计

系统结构设计及子系统划分

系统结构图

网页版VDI客户端主要分成四个模块：

视频流处理模块
音频流处理模块
Web html交互模块
Spice服务端支持模块（opus，websockify）

视频流处理模块详细设计

视频流处理总体设计

视频处理流程图

视频处理流程说明:

Open MediaSource: 创建MediaSource关联到video标签媒体源，参考图3-2
H264 Demux: 对收到h264视频帧数据解析，获取视频相关信息用于解码
SPS? :判断是否为SPS数据，用于浏览器初始化解码器
addSourceBuffer: 创建并添加SourceBuffer到video标签，参考图3-2
Video.play(): 播放视频
GeneratedVideoIS？ : 判断是否已生成过“初始视频帧”
fMP4 Remux :将h264视频帧封装成fMP4帧格式
Generate Video initSegment :根据获取到的视频信息创建“初始视频帧”，“初始视频帧”用于初始化解码器
Push Segments: 将已封装好的分片保存到segments数组
appendBuffer: 将分片填充到SourceBuffer里面
onUpdateEnd: appendBuffer填充数据成功后，会产生updateend事件，onUpdateEnd是处理该事件回调函数，再次appendBuffer。

MSE原理图

视频流处理编码设计

MSE初始化
调用MediaSource()接口创建MediaSource对象，调用CreateObjectUrl创建Blob对象，关联到video标签的媒体源地址。收到SPS后，调用addSourceBuffer接口创建MediaSource的 SourceBuffer，用于之后的视频数据提交。调用play()接口播放视频。
H264解析
H264编码后的数据以 00 00 01或者00 00 00 01划分数据单元，从收到的h264数据流中解析出数据单元，根据数据单元的类型做不同处理，数据单元有以下类型： NDR（1），IDR（5），SEI（6），SPS（7），PPS（8），AUD（9），End of Sequence（10）， End of Stream（11）等，之后生成解码时间，播放时间。
生成“初始视频帧”
根据收到SPS，PPS以及其他数据调用MP4的initSegment生成初始视频帧，initSegment里包含FTYP，moov等mp4 box。之后调用MSE的AppendBuffer接口将初始视频帧填充到 SourceBuffer，video标签获取初始视频帧后初始化fMP4解码器。
普通视频帧封装
普通视频帧根据h264中解析出来的数据单元，构造mdat和moof box，将生成的fMP4 segment 保存到segments数组。
数据填充与回调处理
调用MSE接口appendBuffer执行数据填充算法。在前一个appendBuffer异步接口处理完成后会生成updateend事件，在该事件处理函数onSBUpdateEnd中从segments数组获取segment继续执行appendBuffer操作。

关键问题解决方案

倒转
- 原因：spice 服务端编码的h264图像数据是倒的
- 解决方案：利用CSS3的旋转功能，绕着X轴旋转180度
延时
- 原因：chrome浏览器的解码器默认不是以直播流的模式解码视频帧，所以会在解码的时候缓存4帧数据。
- 解决方案：在fMP4封装中设置mvhd.duration = 0，如果有mehd的话，设置mehd.fragmentDuration = 0，这样chrome 会进入“low delay mode”，不会缓存数据
花屏
- 原因： websocket代理流式传输导致了帧的切割与合并
- 解决方案：在浏览器收到h264数据后自己解析帧的边界，把完整的一帧提交给h264解析器，封装fMP4packet，喂给MediaSourceBuffer。
硬解码缓存，浏览器渲染缓存
- 原因：这是硬解码本身的设计缺陷以及chrom浏览器62版本以后的bug
- 解决方案：第一帧发送两帧冗余帧，并且超时30ms无数据多发一帧，原先发送数据类型为 10,11的数据帧来flush解码器缓冲区的做法会导致video 的played timeranges的随机初始化，进而导致桌面卡住一段时间。
浏览器视频无限缓存
- 原因：浏览器video标签的默认行为
- 解决方案：通过mediaSource的API可以得到当前已缓存的timerange视频数据，和当前已播放的timerange ，每当played.end()-buffer.start()>10 (s)时，调用remove清空前 10s缓冲视频数据。注意remove的调用不能和append调用同时进行，否则会有一个调用失败。
标签页切换跳帧
- 原因：当切换到其他标签页时，video 后台不会解码图像，导致帧在缓冲区中累积，切回时引起帧播放延迟。
- 解决方案1：标签页切回时重新加载，缺点是加载时间较长。
- 解决方案2：切换到其他标签页时，丢弃所有收到的数据帧，切回时改变分辨率（一个像素）强制服务器发送带sps pps的关键帧，从最新位置开始播放。
- 解决方案3：自定义一条display通道消息类型，获取IDR帧（实际使用）。
播放视频时修改分辨率卡死
- 原因：全屏时分辨率改变，在改变分辨率之间仍会收到很多数据，并且重新初始化需要较长时间导致帧卡死。
- 解决方案：在处理全屏时丢弃改变分辨率之前的数据，重新播放改变分辨率之后的数据。
刷新视频帧卡住一段时间不播放
- 原因：因为发送类型为10,11的空数据帧导致
- 解决方案：去掉这些数据帧，改为用冗余帧填充chromebook硬解码的一帧缓存

音频流处理模块详细设计

音频流处理总体设计

音频处理流程图

音频处理流程说明:

Audio Init: 音频处理初始化，包括Opus解码器，PCM 数据缓冲区等
Recdive Opus Data: 从接收的数据包中解析出Opus编码数据
Opus Decode: 解码Opus数据，得到PCM数据
Write PCM :将PCM数据写到PCM 缓冲区
CreateScriptProcessor: 创建音频数据处理节点
Connect Destination: 连接到音频播放节点
Onaudioprocess: 音频数据处理回调，处理更多的音频数据
Read PCM: 从PCM缓冲区中读取PCM数据
CopyToChannel: 将PCM数据填充对象的左右声道

音频流处理编码设计

音频解码初始化
- Spice client音频通道处理初始化，Opus设置音频采样率，通道数，音频脚本处理节点缓冲区大小，构造PCM数据缓冲区等。
Web Audio API
- 调用CreateScriptProcessor创建音频处理节点。调用connect接口将该scriptNode的输出链接到audioContext.destination，及音频播放设备。该处理节点会在onaudioprocess回调函数中从PCM缓冲区中读取PCM数据，填充到对应的左右声道。
解决卡顿、噪音
- 原因：一是浏览器默认音频采样时48000，如果提供44100采样率的PCM数据会出现严重的卡顿和噪音。二是当wifi环境不好，网络欠佳的情况下，由于音频数据不及时，导致填充声道的数据是不确定的随机值，所以导致了噪音。
- 解决方案：一是直接将Opus解码后的48000采样率的音频输出到浏览器，不做重采样操作。二是判断当前PCM缓冲区中是否有足够数据，如果没有，用静音代替。
音视频同步
- 原因：当网络环境不好时，由于出现音视频数据堵塞，但是视频数据以30fps速率播放，在视频帧不是非常饱和的情况下，视频帧会快速的播放完，但是音频首先是以固定时间为一帧来编码，其次以静音代替未到来的数据，后续堵塞住的数据会一直延后播放，导致音视频不同步。
- 解决方案：定期检测PCM缓冲区的数据是否超过一定时间（该缓冲区中的数据时间即代表延时时间），若超过1秒，则丢弃。

html交互模块详细设计

Canvas和Video重叠设计

在video显示层上面覆盖一层透明的canvas画布，用于捕获鼠标点击事件。需要注意的是video标签与canvas的完全重叠，以及分辨率修改后，保证video与canvas仍然完美重叠。

鼠标键盘事件处理

将键盘事件注册到HMTL document，封装按键的keycode等信息成spice协议格式发送给 spice服务端，spice通过VDAgent传递到虚拟机里面执行相应的操作。FlexVDI提供了多套 KeyMap信息，对应英式，美式等各种键盘，一般选择美式键盘keymap即可。另外，由于有一些组合快捷键会被浏览器所在的外部操作系统拦截或者chromebook自带键盘上没有该按键，需要在虚拟机页面的浮动条上提供常见的快捷键操作，如ALT+F4， Ctrl+Alt+Del， Win+L等。

服务端支持模块

Websockify 代理脚本实现

websocket代理启动脚本流程图

websocket 代理启动流程说明:

Read Port File：读取虚拟机端口文件和web端口文件，获取代理端口信息
ID Exist?：判断当前虚拟机ID是否存在端口文件中
Port += 1：当虚拟机ID不在web端口文件或者当前端口已被占用时，尝试新端口
Write Port File：将当前尝试的端口更新到web端口文件
Execute Websockify：使用这两个端口，执行websockify代理
Succ? ：判断代理是否执行成功，成功会一直执行，失败继续尝试新端口

Spice服务端修改

添加Opus音频编码模块
将数据发送到websocket代理服务器
30ms如果没有视频帧数据，则多发前一帧的冗余帧
第一帧多发两帧冗余帧

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
application		application
audio		audio
flexvdi		flexvdi
keymaps		keymaps
lib		lib
network		network
process		process
resources		resources
spiceobjects		spiceobjects
spiceproxy		spiceproxy
wfs.js		wfs.js
Makefile		Makefile
README.md		README.md
index.html		index.html
run.js		run.js
web_client_audio_process.png		web_client_audio_process.png
web_client_framework.png		web_client_framework.png
web_client_h264_video_stream_process.png		web_client_h264_video_stream_process.png
web_client_mse.png		web_client_mse.png
web_client_websockify.png		web_client_websockify.png
websockify-stop.sh		websockify-stop.sh
websockify.sh		websockify.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

需求概述

条件与限制

系统详细设计

系统结构设计及子系统划分

视频流处理模块详细设计

视频流处理总体设计

视频流处理编码设计

关键问题解决方案

音频流处理模块详细设计

音频流处理总体设计

音频流处理编码设计

html交互模块详细设计

Canvas和Video重叠设计

鼠标键盘事件处理

服务端支持模块

Websockify 代理脚本实现

Spice服务端修改

About

Releases

Packages

Languages

MarkRepo/spice_web_client

Folders and files

Latest commit

History

Repository files navigation

需求概述

条件与限制

系统详细设计

系统结构设计及子系统划分

视频流处理模块详细设计

视频流处理总体设计

视频流处理编码设计

关键问题解决方案

音频流处理模块详细设计

音频流处理总体设计

音频流处理编码设计

html交互模块详细设计

Canvas和Video重叠设计

鼠标键盘事件处理

服务端支持模块

Websockify 代理脚本实现

Spice服务端修改

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages