tensorflow安装时遇到gcc: error trying to exec 'as': execvp: No such file or directory. 截止到2016年11月13号,源码编译tensorflow还不支持gcc5.4,我使用的是gcc5.3,使用bazel工具进行编译时遇到上面这个问题,解决方法,将/usr/bin/as放到/usr/local/bin/gcc,和gcc 5.3的版本同个目录下。/usr/bin/as不知道是由那个版本的GCC装上的,还是说系统自带。
由于服务器home目录比较小,满了,但是bazel却默认将下载包放在~/.cache中,可以做如下修改指定存放目录:
The outputRoot directory is ~/.cache/bazel. (Unless $TEST_TMPDIR is set, as in a test of bazel itself, in which case this directory is used instead.)
详细参考网站:https://www.bazel.io/versions/master/docs/output_directories.html
由于bazel是自动下载所需包,感觉和java的maven一样, 有时候网络无法访问外网,可以修改tensorflow目录下的WORKSPACE和workspace.bzl中的url。可以自己将包下载到本地某个目录,/data2/package/xxx.tar.gz,然后修改url = "file:data2/package/xxx.tar.gz"即可。
通过浏览器访问远程服务器的tensorboard,需要设置浏览器代理127.0.0.1端口8080,然后使用ssh命令 ssh -D 8080 dev(只适合我,dev是我配置在config的开发机的化名),参考http://askubuntu.com/questions/112177/how-do-i-tunnel-and-browse-the-server-webpage-on-my-laptop
cifar10训练例子:借tensorboard分析了几种预处理的操作带来的好处,baseline是原版cifar10的例子,事实上only_crop,crop_filp,crop_filp_bright_contrast都是学习率为0.01,导致loss下降比较慢,而设置成0.1loss会发散成nan,必须做std,mean substract才能设置更高的学习率0.1,而黄色的那条线就是结果。